星期三, 五月 30, 2007

点评中国互联网CEO语录

DoNews特稿(朱威廉)
  气壮山河型

  搜狐CEO张朝阳:"我认为国内网站在国内上市是一个好主意。因为只有本地的股民才最了解本地网站的发展潜力,很多的股民本身也许就是某家上市网站的忠实用户"。点评:墙里开花墙外香。

  51.com CEO庞升东:"我们的最终目标是上市,时间可能在三年后,纳斯达克是第一选择,因为我们对那里比较熟悉"。点评:谁不熟?

  腾讯CEO马化腾:无线有100多亿元的盘子,我们必须进去;网游有70多亿的盘子,腾讯不能放弃;广告有30多亿的盘子,腾讯不能放弃;腾讯不能放弃的还有搜索、电子商务。点评:一统天下。

  "MySpace中国" CEO 罗川:"我们的目标是打造中国领先的Web2.0企业"。点评:有你,没我。

  优酷网CEO古永锵:Alexa是儿戏。
  点评:互联网是幼儿园。

  旷世绝联型

  上联:我就是打着望远镜也找不到竞争对手。(阿里巴巴CEO马云)
  下联:我拿着显微镜也看不到冗余劣质资产。("猫扑"CEO陈一舟)
  点评附送横批:人间仙"镜"

  胸怀韬略型

  网易CEO丁磊:"如果方向不对,做什么都不会顺风"。
  点评:如果方向正确,那是不是做什么都不会逆风?

  金山总裁雷军:"成熟团队+成熟经验+成熟产品,快速地崛起,下一个会是谁"?点评:会不会是金山?

  淘宝网CEO孙彤宇:"要让淘宝土得掉渣"。
  点评:要让阿里巴巴富的冒油。

  "6688 "CEO王峻涛:"我如果发现了金矿,好像没有义务告诉别人"。
  点评:如果那确实是金矿,就算你不说也有人会来打劫的。

  分众传媒CEO江南春:"一年出轨一次是道德的"。
  点评:脍炙人口。

  "联想投资"总裁朱立南:"做投资不是把钱给公司,在他们的董事会里占几个席位,开会的时候说几句不咸不淡的话。"点评:你还想干什么?

  Discuz创始人戴志康:"年轻意味着你有更多的时间去补救过错,但反过来讲,市场竞争不会因为你年轻就宽容你,你犯错误别人不犯,你可能就死掉了"。点评:特别送给80后的创业者。

  针锋相对型

  "盛大网络"CEO陈天桥:"华尔街不懂网络游戏"。
  点评:在中国召开"华尔街网游培训班",让分析师们搞懂后再重新持证上岗。

  "征途科技"CEO史玉柱:"我在你们的游戏上花了数万元钱,我了解每一处细节。说游戏你说不过我。我好好教教你"。点评:请史老师出任"华尔街网游培训班"讲师?

  "点击科技"总裁王志东:"合作伙伴也欢迎我的加盟,我可以帮助他们抵制'腾讯'的入侵"。点评:还来得及么?

  "谷歌中国区"总裁李开复:"再过半年,Google任何本地化的破绽都将被弥补"。点评:我们相信――只要有"搜狐"把关。

  "TOM"总裁王雷雷:"什么历经坎坷、个人奋斗,成功在于运气"。
  点评:建议创业者们都去算一卦,没那命就别瞎操劳了。

  "英特尔中国区"总经理杨旭:我从来不接受"NO",通常我会说服到对方信服为止。我充分相信我的影响力和说服力。点评:Oh yes

  直言敢说型

  "新浪网"高级副总裁、总编辑陈彤:"概念本身并不重要,重要的是应用"。点评:实话实说。

  "奇虎"董事长周鸿祎:这个社会上谁的屁股都不干净。
  点评:那就都别擦了。

  百度CEO李彦宏:"我奉劝Google的CEO能像eBay的CEO一样,一年有半年在中国工作,这样可能会更了解中国市场,还会更有希望"。点评:李开复老师不是一直在么?

  "空中网"CEO杨宁:"我们是光着脚的,他们是穿鞋的,光着脚的从来就不怕穿鞋的"。点评:现在的情况是,脱了衣服的更不怕穿着衣服的。

  原"雅虎中国"总裁谢文:"执掌雅虎中国我有九成胜算"。
  点评:失算。

  "联想集团"CEO杨元庆:"我们最大的对手就是我们自己"。
  点评:无敌。

  "Blogbus" CEO窦毅:"我们期待着,中国的'Internet大工地'上,能出现像Google那样的与众不同的建筑,而不是有更多的表面花哨里面却是豆腐渣的烂尾楼。点评:美国只有一个Google,中国只有一个Blogbus.

  "AMD中国公司"总裁郭可尊:"当一个领导者关键是看他是否具有管理的能力,不是看他穿裤子还是穿裙子"。点评:为什么现实中绝大多数的老总穿裤子,而秘书却穿裙子?

  "红杉"合伙人沈南鹏:"我一直认为做成一件事情需要很长的时间,谁知道只用了如此短的时间,不能不说有幸运的因素"。点评:时也,运也,命也。

  "KPCB"中国合伙人周志雄:"在这个行业中声誉是最重要的,一个人的案例会跟着他一辈子,所以个人必须对自己的案例负责"。点评:创业者要竖贞节牌坊。


  成功回味型

  "Majoy"总裁茅侃侃:"我的工作和游戏有关,我积累财富的过程和'玩'字也脱不了关系。"点评:游戏人生

  "泡泡网"、"汽车之家"CEO李想:"一个人如果到了20岁都还不清楚自己的性格和立场到底是什么,那挺可怕的"。点评:很多80前的人都白活了。

  原"Mysee"总裁高燃:"现在的绝大部分青年人,将成长的目标和努力的方向定位于经济利益上,反观近几年火爆于媒体的青年创业才俊,有政治抱负的可以说是凤毛麟角"。点评:入错行了。

  "中华英才网CEO"张建国:"要做就要做好"。
  点评:要说就要说大。

  土豆网创始人王微:"创业是做自己的东西,虽然与之前的想法有落差,但是上了贼船就下不去了"。点评:VC上千万美金都上船了还会让船长下去?

  "豆瓣"创始人杨勃:"你看一本书,在豆瓣看到有10个人看,这样带来的惊喜,比你发现一本书有1万人在看,要强烈得多"。点评:真理总是掌握在少数人手中,文化亦是如此。

  "宝宝树"创始人邵亦波:"如果做一个事情,都要超越以前,那活的太没意义了。能做大当然最好,如果跟自己比赛,那会太累"。点评:上山容易下山难。


  幽默风趣型

  "世纪佳缘"CEO龚海燕:"我们家在湖南农村,我奶奶就是方圆百里鼎鼎大名的媒婆,我老妈也名气不小。我最大的爱好就是给人'做媒'"。点评:家族企业。

  当当网CEO俞渝:"每年情人节都是我和我老公最忙的时候"。
  点评:希望他俩一年365天,天天情人节。

  "第九城市"董事长朱骏:"从没想过拿足球赚钱:每年5000万就是来玩的"。点评:网游推动了足球。

  "博客中国"CEO方兴东:"我最不快乐的互联网时光就是拿到了1000万美元的阶段"。点评:给我吧。

  "百合网"总裁田范江:"当初招聘的时候没人来,我们说自己是交友网站,求职者觉得我们是搞'一夜情'的,不肯来;后来我们改说是做婚介的,人家更不敢来了"。点评:关键不是你们做什么,而是做的够不够大。这不,员工全来了。

  "大众点评网"CEO张涛:"餐饮企业说大众点评网不是餐饮企业,互联网企业说大众点评网不是互联网企业"。点评:他们若是知道了哪里还有你今天?

  图葩网创始人朱威廉:"如果MyTupa失败,我就从此消失。"点评:跳楼还是投江?(完)

十点论坛管理经验(转)

文章是我在网站的实际管理中的一些经验,现于大家一起分享。希望能和大家一起交流一起进步,共同把自己的论坛做得更好。

一、准确定位与发展方向

一个论坛的发展初期就是要找准定位,根据自己的定位选择适合的人群。然后针对人群特点宣传。例如我们日光海岸(原SunXP),02年开始发展的时候定位在了学生站点上,那么适应我们站点的人群就是所有的学生玩家。

我们对联系了一些学校的学生会,学校领导,得到了一些支持和宣传的机会,当初管理人员也在网下到每个学校进行了一些宣传。其实也很艰苦的,有几次被门卫赶出来了。但作为管理人员来说,必须经受这些艰苦。

免费论坛软件 对于论坛的定位,这点是论坛开设前都必须要考虑到的问题。也是伴随论坛发展的关键性问题。只有能正确的把握自己的定位才能不断进步!

并需要有一套完整的与其定位相适应的发展总方向,这样一个规划,可以引导论坛在任何时候都不回背离这个发展方向而走偏路。

二、人员选拔与人事任免

一个成熟的论坛必定有自己的人事选拔与任免制度,可以这么说,论坛的第二大关键在与斑竹。

斑竹的业务水平和技能的的高低,直接影响到论坛版面的发展。斑竹是管理员与会员们沟通的桥梁和纽带。所以人员的选拔和任免需要有相应的制度做依据,正所谓国有国法,家有家规,论坛也有适应于定位的规定,人员选拔是这些规定中的重要组成部分,所以我认为,这一点是必不可少的。

引用《天下无贼》中的一句话吧:“21世纪什么最缺?人才!”人才的任用是很重要的。把该用的人用到最佳的地方,会收到很好的效果!而且会带来很好的人气。

我认为,作为管理者必须考虑到这一点。这一点也成为论坛兴亡的关键!

最近有些论坛的管理员问我,“论坛人气怎么一直不高?”我想这应该与斑竹的负责与不负责,有直接的关系。人气不是靠拉,是靠斑竹们的带动!

三、版面设计与整体规划

论坛 一个优秀的论坛,肯定少不了合理的版面设计与规划。这些版面的规划必定要参考于论坛的定位。有些管理员可能会认为,只要是合理的版面就可以开了,其实不然,实际上一个版面(不论是主版面还是子版面)的开设,都需要管理人员去细心的做调查研究,开设之后对论坛会有什么样的效果,增加了多少访问量等等。这些问题都是要在开版之前考虑的。因为开版容易撤版难。

我认为如果是综合类网站,涉及的相关领域很多,应该在主版面下细分子版面,分到不可再分为止!例如:我们日光海岸的学区 按地域的分布划分成8个主版面,江岸学区,桥口学区等,在把学校归属与学区之下,这样作到了细分,也就是按学校为最小单位,细分版面。每个学区设置一个区域主管,主要负责管理该区域下的斑竹。另,合理的整合现有的版面资源也是管理者们需要考虑的问题之一。

四、团队精神与团队形象

1、论坛的建设不是一个人能够完成的,其中必须要有一支好的管理团队,这支队伍的思想上都要保持高度的统一,个人也需要比较高的修养。这样一支有朝气的管理团队,可以带动论坛的生机。

在团队中,必须学会团队协作精神,因为有些工作无法单独完成,这必须和他人协作完成。所以处理好团队队员之间的关系有为重要。我想如果有这样一支管理团队,那么对论坛的发展是很有好处的!

2、管理团队的分工合作问题

团队中的成员,必须有合理的分工,分工不要重复。分工可按组分配,或按权限分配php,论坛,按组分配可分为:技术组,宣传组,日常管理组,活动组,规划组等等。每个组的组长为管理员,成员为总斑竹或有权限继承的斑竹:按权限分配可分为:管理员 总斑竹 区域斑竹 督察等。以上只是我自己的一些看法,具体的情况还要具体分析和对待!

五、开展活动与活动形式

我认为论坛能否凝聚住人气,很重要的一个方面在于活动。不论是网上活动,还是网下活动,活动可以使论坛更吸引人。

活动分为很多种类,有娱乐型的,竞技型的,也有纪念型的活动等等,一个活动的成功举办,一可以选拔一些组织能力强的人,二可以促进管理人员和会员们的交流。作为管理者也要经常走入会员中,听取会员们合理的意见和建议。关于活动,我还是有点经验于大家分享。

例如:日光海岸这回三周年的系列活动,都是由我策划并组织的。

包括有游戏竞技类活动,网下的参与性强活动,征文活动,签名活动,网络电台的特别节目,会员大合唱等等。并和武汉地区学生的313街球联盟合作,一起举办了一场街球表演。举办的非常成功,也得到了大家的好评。这回三周年我们准备了一个活动周,是从4月28日(日光生日)开始,一直到5月4日,持续7天,7天内网站上和网下都有我们的宣传活动

这样的活动给论坛带来了更好的人气,带来了更快的发展速度,在活动中也涌现了一批组织型人才。这些人才必定会在今后的发展中,起着至关重要的作用!

六、网站多样化发展

当聚集了一顶的人气的时候,网站的经营者需要开辟一些多样化的发展思路,比如说,开设分站或设置一些插件。这样让会员们感觉到论坛每天都是新的!

免费论坛软件但这些分站都是依赖与论坛而发展的,为会员们提供了多元化的服务空间。

这样的多元化服务,都是要迎合会员们的喜好而定的,也必须参考自己网站的定位!

软件这个一点,必须在论坛有一定的持续性人气的同时才能开始开展,而且开设的时候要把握度的问题,不能太多,否则无法突现重点,我想管理人员的重点依然要放在论坛的管理与策划上这个分站的开设,对成熟的论坛可以起到画龙点睛的作用!

七、论坛管理与会员服务

首先谈谈论坛的管理,我认为管理也应该有一个明确的制度,什么样的行为不能做,什么样的行为是违规的。这样有一个明确的管理制度,对论坛的正规化、体制化发展是很有好处的!各位管理人员也需要用心去管理,有人曾经问我怎么去管理论坛,我回答了四个字“用心管理”。

这简简单单的四个字中蕴涵了很的多,作为管理人员要从全局的角度看问题,不能局限于某一区域的利益,眼光必须放开,才能有利于论坛的发展。

再简单谈一下会员服务,一个公司的兴亡很大程度上决定与一个好的客户服务,一个服务态度好,业务水平高的客服,会使公司在客户中有很好的口碑。论坛的上也是一样。面向的对象是广大的会员们,主要针对会员们在平时使用论坛的时候各种疑问给予准确的回答。

对于会员服务方面我是有过一段经历的,04年的5月份日光海岸组建了新手村(4个月以后改名为会员服务中心),主要负责解答会员们的关于论坛的疑问。当初建立的时候,招聘了4会员,作为解答员,加我以后负责错误的操作,一共就五个人。这个会员服务中心身受会员们的好瓶和赞誉。后来业务足见扩大,所以11月对外再公开招聘了4个解答员。今年年初会员服务中心改革,把会员的集中的问题分为几个版面,目前会员在会员服务中心里不但可以得到更专业的解答论坛问题,还可以咨询到论坛最新的动向。解答员也不局限与在论坛上解答会员,通过多样的形式,比如电话、QQ等等。

会员服务中心从开设到今天已经接待了5万人次的解答询问,可以说,会员服务中心也成为了直接面队会员们的又一平台。

八、监督与奖罚制度

为了给各位管理人员分担工作,所以可以设立一个督察组,监督斑竹,监督会员灌水,骂人等等违反社区规定,这样管理员最终负责的是论坛的操作工作和决策。

奖罚,永远是并存的,有奖励就有处罚。对于对论坛有这巨大贡献的会员或斑竹应该及时的提出表扬,或给予一定的分数或头衔奖励。并同时处罚一些论坛上违反规定的会员或斑竹。

我认为这个奖罚制度也应该有明确的规定,什么时候该奖励什么时候该处罚。这样在具体操作的时候做到有据可依,有规可寻。不会是论坛产生一些不必要的矛盾。这点是很必要的。

奖罚制度的实行可以最大限度的调动会员们的积极性,使论坛走上良性循环的轨道!

九、合作与竞争

和其他网站合作或做链接一直是网络宣传的手选方案,关于合作我想谈几点,第一,要找到合适于自己定位的其他网站做联盟站点。第二,循序渐进,由小到大的做链接,不要一开始就把要求定得很高,这必须合理的把握自己论坛的状况。第三,合作不一定局限与网络,还可以和一些公司或组织搞合作,这需要管理人员们要有敏锐的洞察力,能发现并能完成合作。第四,论坛上广告的放置要合理,不然会带来会员们的不满之声。

关于竞争,我一直把伊利集团公司介绍里的一篇文章《狮子与羚羊》作为我做事的原则。这篇文章大体讲的是,狮子和羚羊在生存中面临的挑战实际上是一样的。羚羊不能跑过狮子,将被狮子当作美餐,而狮子如果不能跑过最慢的羚羊,那么也会饿死。可见生存的压力是同等的!

要么做的最好,要么被淘汰,这样一种生存状态是值得我们每个人自醒的!特别是我们的管理人员。这样一来,对于竞争我们要正确看待它,把它当做机遇也要当作挑战。把自己做强大是最重要的!

十、坚定信念与合理创新

要做一个成功的站点或论坛必须要坚定一个信念,成功的信念。如果管理者都没有一个成功的信念,那么这个论坛或网站将没有希望!所以作为管理者的我们必须要树立信心,有了信心才有坚持的动力,最近有些人跟我说做网站很累的,的确不错,是很累,很多事情要操心,要去做!但我认为只要有了信心这一切都是快乐的!累也是快乐的!

作为管理者我们必须有清醒的头脑,认清形式,并学会创新。在网站内容形式上创新,在活动上创新,在管理制度,奖励处罚方式上创新。我想这样的论坛才是精彩的!

后记:

罗罗嗦嗦的写了这么多,这也是对三年的管理经验的一点点浅谈,只是和大家交流一下`希望和大家一起进步!~因为时间关系,还有很多具体的都无法写出来。其实我们的网站还有很多不足的地方,也希望大家提出意见和建议。更希望大家也把自己的管理经验给我们大家一起分享!

一位站长对论坛运营的见解

中国网民上网作什么?不要看CNNIC的互联网统计报告!
通过在下对网吧的观察研究,16个字: 游戏电影,男人泡坛;听歌交友,女生聊天
大体上,你随便抓出10个人,8个人在做这16个字!!! 这就是中国的互联网主流!而不是什么WEB2.0! 这里在下只谈谈以“论坛”为中心的网站如何运营!如有谬见,这里高手众多欢迎指正!

1,论坛不需要“绚”!论坛要的是实用,适用,稳定而快速:
在中国互联网,你只有30秒的推销自己机会,不会有太多的人很耐心等待你的蜗牛缓冲页面;论坛要的是快速!!!
在中国互联网,你只有90秒的推销自己机会,不会有太多的人去理会你的那些花哨论坛插件;如果一个功能不能在90秒.....
在中国互联网,你只有1次的推销自己机会,不会有太多人在意你用什么ASP,PHP还是什么ISP的;如果你的论坛出现一次当机,你就失去人们再次光顾你的机会!论坛要的是稳定!!!

2,论坛要的是人气,不是人流;
做坛子最忌讳的是为了人流而人流!为了吸引流量,国内站长的普遍做法是:累积一大堆的帖子,其实是一堆的“热词主题转贴”! 结果是有人流没人气,来的人多是潜水,偶尔冒出个“好”,“不错”,当然也有“213123bvfghfb”些不知所云的帖子! 做坛子不是这样的!

3,让会员跟着会员动!
做坛子不是让你的会员跟着站长的指挥走,而是让让会员跟着会员动! 人们所以喜欢坛子,因为这里的人率直,有见解,彼此互动中也是一个“英雄会知己”的过程!它是一个坛子的生命力所在! 这是什么,就是论坛的人气!!

4,失败的坛子都是因为没有原创特色,不能吸引会员;失败的坛子都是因为没有写原创帖子的会员,不能会员留住会员!
那些写原创帖子的会员是论坛的“生命之源”,站长要大胆给他们管理权,要大气的封给版主,千万不要让你的“生命之源”消失。 最后,站长在进行论坛型网站运营时要注意,论坛的每一个行动决策的推出: 都应该是民意的体现!也都应该必须是会员的呼声体现!
这个很重要,不要犯错!中国人总是喜欢为别人做安排!!!

论坛运营之论坛拉人的方法

拉人方法1:访问你论坛的人就不要放过,找几个吸引人的题目,让游客想注册,注册后,你要躲在旁边监视着,只要看到新注册的会员,要马上和对方打招呼,让其感觉到自己受重视,这样有了交流,就很容易留住人。
拉人方法2:现在的网友大部分都有QQ吧?多的人QQ上几百人。少的也有几十个,让这些QQ上的朋友帮助宣传你的论坛。如果你论坛中有几个很吸引人的东西在(比如说恶作剧的工具或是恐怖或是特别搞笑的图片。。。)把这个图片和你的网址让QQ上的朋友转给他们自己QQ上的其他朋友,让更多的人去你那里注册,去玩。就这样金字塔式的传下去的话,数字很可怕的。
拉人方法3:去申请一个新QQ,当然要冒充个MM的名字呀。这样还是比较有诱惑力的。然后去QQ里查询。不停申请加入好友。说几句话,混熟了,马上邀请他到你的论坛去玩,这个方法所得到的访问量要比通过友情连接来访问的人多哦。只要你勤奋。每天拉到几十个新人应该不成问题吧。。。呵呵
拉人方法4:呵呵。老土的方法。发送垃圾邮件给广大网友了~
拉人方法5:专跑到有名气的大站点,虽然你的注册会员才100人不到,对方已经几十万,那又如何?申请做个连接先~ 反正大站点人多,申请连接的帖子也有人爱看,虽然连接可能性小,但是毕竟会有人去自己站点看说不定就爱上你的站点呢:P
拉人方法6:如果会写点东西。可以尝试去什么地方投个稿子,顺便把自己网址写进去哦
拉人方法7:你的论坛上一定要有几个可爱的MM长时间在那里蹲着,看到有人发新帖子,马上就回复。管他是不是灌水,先回答再说,GG,DD有几个不是恐龙的,有几个看到JJ,MM回复自己帖子而不乐晕的。很容易就上钩了。。。
拉人方法8:你又笨,又蠢,又懒,还想自己的论坛出名?学王朔吧~找个网络里知名的人骂骂,找几个大站点的管理员骂骂,狂骂之余别忘记顺便装做不经意的把自己的网址写上去,呵呵,就等着访问量增加吧。说不定还会有很多人赞同你的观点而成为你论坛的知己呢。不过一定要确认对方不会用法律途径找你麻烦,也不会顺手黑掉你的服务器。。。否则你可就损失大了。。。

星期一, 五月 28, 2007

转换硬盘格式 fat→ntfs

convert drive:/fs:ntfs

Java 平台的 Jazzy:一种新的拼写检查器 API

字符串相似性算法

您还记得这样的字谜么--每次只允许修改单词的一个字母,就能把它变换成另外一个单词?例如, ship可以通过逐步修改变成 crow,通过中间单词 shop、 chop和 crop。这种游戏为您提供了一条路,可以清楚地理解两个单词之间的距离这一概念。 距离是从一个单词变换成另外一个单词所需要的步数,要求是每次只能改变一个字母,而且每步都要使用字典中实际存在的单词。我把这叫做 字谜距离(puzzle distance)。在这个示例里, ship和 crow之间的字谜距离是 4。

虽然我们经常把距离当作是空间中二点之间的物理度量,但是数学家则用更具一般性的概念把它定义为 度量(metric)。这个定义让您可以在不同的应用程序中使用距离的概念;在这里,您感兴趣的是两个字符串或两个单词之间的距离。它的意义在于,对于拼写错误的单词,您应当查找和它“接近”(这就使用了距离的定义)的单词。距离度量的任何定义都必须满足一些可以度量的属性;例如,距离永远不可能为负。

虽然顺序比较有许多方面(请参阅 参考资料),但是您的目的是找到距离的定义,使距离有助于实现良好的拼写校正。前面定义的字谜距离至少有一个理由不适合做这项工作:拼写错误的单词比起正确拼写的单词来说,通常不止错了一个字母。例如,对于拼错的 puzzel,找不到“路碑”可以到达拼写正确的英文单词。幸运的是,已经设计了大量适用于拼写检查的度量方式。

动态编程算法

动态编程算法从本质上看是一种穷举方法,它会考虑到把源单词转换成目标单词的所有不同方法,从而找到成本最小、或者单词间距离最短的方法。 Levenshtein 距离算法是动态编程算法的一个具体实现,它允许进行三类操作,把源单词 x转换成目标单词 y:

把单词 x中的一个字符 替换成单词 y中的一个字符


把单词 x中的一个字符 删除


在单词 y中 插入一个字符

每个操作都会有一定的成本,而总距离就是从单词 x变换到单词 y 的最小成本。从直观上看,基于这些操作的算法应当可以很好地进行拼写校正,因为打字错误无外乎是这些操作所涉及的键入错误。(实际上, Levenshtein 距离也称作 编辑距离。)例如,当我把单词 wrong打成 wromg(按了 m键,而不是 n 键)的时候,就是一个替换错误;当我打成 wromng(按了 m键,还有 n键)的时候,就是一个删除错误;而当我打成 wrog(遗漏了 n 键),就是一个插入错误。

计算距离

为了更好地理解动态编程算法,可以画一个表格,它的行对应源单词的字母,它的列对应目标单词的字母。处在 (i, j)位置的单元格代表从源单词的 i字母到目标单词的 j字母的最小距离。

对于 Levenshtein 距离,删除和插入的成本为 1。如果字符有差异,那么替换的成本为 1,否则为 0。开始算法的时候,您先填充第一行,第一行对应着空的源单词,这样它就是插入 0,1,..., j个字母的成本。同样,第一列对应着空的目标单词,所以它就是删除 0, 1, ..., i个字母的成本。如果您以 pzzel到 puzzle 的转换为例,那么您会得到如 图 1 所示的网格。


图1. Levenshtein 算法的第一阶段




















接下来,您要计算余下的每个单元格的值,通过考虑它的三个邻居来计算:上、左、对角上和左。图 2 显示了这个计算方案。


图2:如何计算单元格的成本
对角 上
左 Min(
对角+ 替换成本,
上+ 删除成本,
左+ 插入成本
)

例子结果网格如图 3 如示。右下角单元格的成本是 3,是 pzzel和 puzzle之间的 Levenshtein 成本。


图3. Levenshtein 算法的最后阶段


Levenshtein 算法的属性

作为额外优点, Levenshtein 算法还为您提供了一系列操作,也叫做 校准(alignment),它构成了转换。一对单词通常有不止一次校准。校准对应着沿图表的箭头从左上角单元格到右下角单元格的最小成本路径。例如, 清单 4表示的校准(在 图 3中以红色箭头表示),可以按照下面的操作顺序,一个字母一个字母地读成:

把 p替换成 p(成本为 0)


插入 u(成本为 1)


把 z替换成 z(成本为 0)


把 z替换成 z(成本为 0)


插入 l(成本为 1)


把 e替换成 e(成本为 0)


删除 l(成本为 1)



清单4. pzzel 和 puzzle 之间的校准

p-zz-el
puzzle-



Levenshtein 算法的 Java 实现

清单 5 列出了 Levenshtein 算法的一个简单而直观的 Java 实现。 LevenshteinDistanceMetric 类有些类似于 Apache Jakarta Commons 项目的 StringUtils 类。这些实现的限制是:它们不能处理大型字符串,因为它们的存储需求为 O(mn), 其中 m和 n 分别是源单词和目标单词的长度。如果您只需要计算距离,不需要校准,就像通常情况那样,那么可以很容易地把空间需求降到 O(n),因为计算下一行只需要前面一行。针对 Apache 版本已经提出了一个修正建议(请参阅 参考资料),但是它在本文写作的时候还没有被合并进来(2.0版)。

请注意: Levenshtein 算法的运行时间总是 O(mn)。所以,如果在非常大的字典里查找拼写错误的最相近匹配,这个算法就太慢了。


清单 5. Levenshtein 距离算法的实现

public class LevenshteinDistanceMetric implements SequenceMetric {
/**
* Calculates the distance between Strings x and y using the
* Dynamic Programming algorithm.
*/
public final int distance(String x, String y) {

int m = x.length();
int n = y.length();

int[][] T = new int[m + 1][n + 1];

T[0][0] = 0;
for (int j = 0; j < i =" 0;" j =" 0;" suggestions =" event.getSuggestions();" i =" suggestions.iterator();">");
System.exit(1);
}

SpellDictionary dictionary = new SpellDictionaryHashMap(new File(args[0]));
SpellChecker spellChecker = new SpellChecker(dictionary);
spellChecker.addSpellCheckListener(new SuggestionListener());

BufferedReader in = new BufferedReader(new InputStreamReader(System.in));
while (true) {
System.out.print("Enter line to spell check (return to exit): ");
String line = in.readLine();

if (line.length() == 0) {
break;
}
spellChecker.checkSpelling(new StringWordTokenizer(line));
}
}

}




main() 方法用命令行指定的文件建立了一个 SpellDictionary 。 SpellDictionaryHashMap 实现在内存中保存单词,这样比较快,但是对于大型字典不适合。 (对于容易引起内存不足的应用程序,还提供了基于磁盘的实现。) SpellDictionary 被用来构造 SpellChecker 对象,在用标准输入填充之前,先用它注册 SpellCheckListener 。拼写检查器通常内嵌在用户驱动的应用程序里,而事件驱动的设计本身就适合这类程序。在这个例子里,侦听器( SuggestionListener )只是在接收到 SpellCheckEvent 事件时,向标准输出写出拼写错误和建议列表。清单 7 显示了一个运行示例。


清单7. 用 Jazzy 进行拼写检查

Enter line to spell check (return to exit): choklut biskit
Misspelling: choklut
Suggestions: chocolate
Misspelling: biskit
Suggestions: biscuit
Enter line to spell check (return to exit):



这个例子非常简单,更复杂的应用程序可以利用 Jazzy 对用户字典管理的支持,执行向字典增加单词、忽略单词、用选中的修正自动替换重复错误拼写等任务。要获得详细信息,请参阅 SpellCheckEvent (在 参考资料中)的 API 文档。

结束语

在撰写这篇文章的时候,Jazzy API 仍然是一个 alpha 软件,版本号为 0.5。作为一个相对年轻的 API,Jazzy 的改进和扩展是公开的。对于初学者,Jazzy 更多地表现出相对于它的近亲 Aspell 所做的一些改进。如果更进一步的话,Jazzy 对于设计上下文感知或语法感知的拼写检查器来说,会是一个理想的框架(使用自然语言处理的一些特性而不是简单的单词列表)。

事实上,Jazzy 是稳固的。虽然对于在 Java 平台上开发拼写检查软件来说仍然是个相对简单的 API,但是因为 Jazzy 是开放源代码的,所以任何人都可对它未来的发展做出贡献。而 API 也可以被用作框架,对其进行扩展后用于内部应用程序开发。请参阅 参考资料一节,了解更多本文所讨论的算法,以及 Java 平台的新拼写检查器 API--Jazzy。

星期五, 五月 25, 2007

笔记本新机检测

无论JS们的技术再高,电脑的性能是不会因为他们的花言巧语而提高的.
所以,在时全面合理的检测,不仅可以免去日后的诸多麻烦,也可以避免JS不认帐.

1. 包装及附件:

外箱标签本本型号是否与预定机型完全一致 是 □ 否 □
生产日期是2006年第几周的产品,是否较新 是 □ 否 □
外包装箱是否清洁、完整、无损伤 是 □ 否 □
外包装箱红色封条及上下封口胶带是否完整 是 □ 否 □

内包装箱是否清洁、完整、无损伤 是 □ 否 □
内包装箱封条及上下封口胶带是否完整 是 □ 否 □

内包装塑胶袋是否清洁、完整、无损伤 是 □ 否 □
内包装塑胶袋封条是否完整 是 □ 否 □

附件包装盒是否清洁、完整、无损伤 是 □ 否 □
附件包装盒封条是否完整 是 □ 否 □
按照装箱清单核对附件,是否齐全 是 □ 否 □
电池是否全新,接口是否有磨损、触点,电池的容量是否和标示一致 是 □ 否 □
附件、电池序列号是否与装箱单相符 是 □ 否 □

附件:电池、鼠标、电源适配器、S端子转AV线、电话线、擦屏布、驱动盘、Nero盘、DVD播放盘和诺顿、说明书、四联质保单

2. 本本外部检查:

外壳是否完好无损,是否有划伤、掉漆、松动、指纹 是 □ 否 □
外壳颜色是否一致、无偏色 是 □ 否 □
键盘与屏幕之间隔离布是否平整无折痕 是 □ 否 □
液晶屏保护膜是否完好、平整 是 □ 否 □
液晶屏是否有划伤、磨损、指纹 是 □ 否 □

键盘、快捷键、触摸板是否手感良好、外观平整、无使用痕迹 是 □ 否 □
D面底脚是否有磨损 是 □ 否 □
各螺丝是否紧固,有无磨损 是 □ 否 □
锁孔、电池卡槽、机身各接口、屏幕转轴处是否有磨损、划痕 是 □ 否 □
散热孔内是否有灰尘 是 □ 否 □

本本序列号是否与包装箱、保修卡相符 是 □ 否 □
本本合盖后是否严密、无缝隙 是 □ 否 □
光驱舱口是否严密、无缝隙 是 □ 否 □

3.本本功能检查

开机后是否进行系统解压恢复 是 □ 否 □
重启后进bios,序列号是否与装箱单、质保证明相符 是 □ 否 □

系统硬件管理器各部件驱动是否正常,是否有未识别硬件 是 □ 否 □
键盘各按键是否手感良好,Keyboard Test检测键盘上每个按键能否正常工作 是 □ 否 □
附送鼠标是否移动正常,各按键手感良好 是 □ 否 □

Everest检查整机的配置,是否和配置单一致,并做简单的测试 是 □ 否 □
CPU-Z检查整机的配置,是否和配置单一致 是 □ 否 □
Hwinfo32检查整机的配置,是否和配置单一致,并做简单的测试 是 □ 否 □
HDTune测试硬盘的使用时间和性能状况 是 □ 否 □

PCMARKS测试整机性能,是否正常 是 □ 否 □
3DMARKS测试显卡性能,是否正常 是 □ 否 □
Ntest、DisplayX测试屏幕的表现能力(如对比度、色彩等),是否有坏点。 是 □ 否 □
检查屏幕是否出现漏光现象。 是 □ 否 □

光驱读盘是否有噪音、振动 是 □ 否 □
CD Speed 测试光驱的传输率、搜索时间、CPU的占用率 是 □ 否 □
盘片的材质,最高支持速度,容量。 是 □ 否 □
BatteryMon v2.0检查PC电池使用状况是否良好 是 □ 否 □
查看电池的充电次数是否较少 是 □ 否 □

各USB口是否正常识别、读取数据速度是否迅速 是 □ 否 □
读卡器是否正常识别、读取数据速度是否迅速 是 □ 否 □
触摸板是否反映灵敏、手感良好 是 □ 否 □

音箱外放音质是否清晰、良好、无杂音,音量是否正常 是 □ 否 □
耳机接口音质是否清晰、良好,麦克风接口是否正常 是 □ 否 □
内置麦克风是否正常,试录音频是否清晰,音质良好 是 □ 否 □

电源适配器是否供电平稳、正常,是否过热,是否有电流声 是 □ 否 □

4.收尾工作

索要赠品:内包、优盘、耳机、鼠标垫、笔记本锁… 是 □ 否 □

上网注册笔记本,确认电池保修期延长 是 □ 否 □
要求商家刻录一张正品操作系统盘,并作一键恢复。 是 □ 否 □

交款开发票。发票是否为正式增值税发票,发票印章是否与商家名称一致 是 □ 否 □
发票是否标明机器型号、购买时间 是 □ 否 □




建议打印出来买机时带着 然后一项一项检测 就能把好质量关了

笔记本购买N大误区

索引——

1. 所谓CPU的散热问题
2. 关于什么是迅驰技术
3. 关于64位技术
4. 关于CPU的主频问题
5. 售后问题
6. 关于网速及稳定性问题
7. 关于各种无线网卡
8. 过节&促销
9. 笔记本电池的使用
10. 开不开发票?开什么发票?

1. 所谓CPU的散热问题


“AMD的CPU散热不好啊”这个是我遇到的最多的问题了, AMD的U在以往给大多数人所留有的印象便是高功率高频超频能力强,但发热量大。所以这种印象使许多人对采用AMD CPU的本抱有怀疑的态度。
可其实大多数人不知道如今AMD的移动CPU在功耗、制程等方面早已经今非昔比,虽然相比INTEL的65纳米工艺,90纳米的制程还是相对落后点,但在功耗及控制上已经全面赶超INTEL,比如炫龙双核的功耗在32W左右,比酷睿2的34W还要低些。
有的朋友就会问比如HP的V3240这种使用AMD的CPU的机子那怎么还会存在散热不好的问题呢?还有比如华硕的F3QT50TC最近也有很多朋友反映在右键托处会非常热,便由这些情况而认为是AMD的散热不好。

其实笔记本的发热量问题现在已经跟CPU没太大关系了,关键在于具体品牌具体型号的设计工艺上,比如在散热设备上有多少投入,以及一些其他因素。
举个例子吧,我的联想昭阳E290和旭日410的模具几乎是一样的,只是颜色一个纯黑一个银白,以及细节设计上有些须差异。昭阳E290是面向商务用户的,但保修只有一年,旭日是面向家庭娱乐用户的,并且有两年的质保,这样核算下来如果配置相同,两个机子的差价达到一千块!


大多数人就会不明白 怎么同样牌子,看着外观一样,配置也一样的机子会差那么多钱呢?
浏览器出点问题直接上不了图,就把图片文件传上来吧
http://up2.zol.com.cn/bbs_upload/upload/2007/05_23/1179916024198.jpg

看这张图片吧,某天我把朋友的旭日410和我的昭阳E290拆开后做的对比,上面的是旭日410,下面是我的昭阳E290。懂行的一眼便能看出,昭阳E290对CPU使用了双铜管散热,而旭日410仅使用了单铜管,在散热口及主板芯片组上E290都使用了铜管散热,而旭日仅是用了铝板进行辅助导热。

不要小瞧这么一个铜管,这里面可是真空结构,装有油状分子和纤维的混合物,使其沸点远小于水,这样铜管的一头架在发热设备如CPU,芯片组上,另一头连接出风口散热片,使风扇可以对其进行直吹。这样当铜管一端受热使其中的混合物雾化,在靠近散热片和出风口的位置重新冷凝液化释放热量,这样就充分利用了纯物理的散热方式。

这样的结果是最近我的CPU一直稳定在50度左右,而旭日410要相比高10度左右。大家都应该知道发热对于硬件的使用寿命的影响,其实散热还会对电池续航时间产生比较明显的影响,因为风扇转动的功耗可是很大的~散热不好的机子风扇会长时间转动,噪音等问题也是比较明显的

再比如F3的右键托发热问题,其实在我拆开几台不同CPU的F3后发现受于内部结构过于紧凑以及或许设计人员考虑到15.4宽屏大尺寸机型对于散热问题并没有过高的要求,因此缩减了对于散热设备的相关投入,比如采用了单铜管且相对较细,使用铝制导热等。并且由于右键托处采用减薄设计加上外壳材质导热性较好,就使得这个位置的发热问题会比较容易引起注意,并误归结为CPU的发热问题。

或许这样就能部分说明为什么有的机子散热好而有的机子散热不好,我想说的其实这并不是由CPU决定的,而是具体品牌具体机型的设计所决定的。因此在买时最好找到真机并运行一段时间测测工作温度,因为这也是影响笔记本整体性能的关键之一。一般如果同样价格,配置相对高的本散热都不会很好。



——————————————————————————————————————


2. 迅驰技术

迅驰是什么?不过是INTEL将其以往的单件产品进行打包销售而提出所谓“迅驰平台”这一概念,由INTEL自家生产的CPU+主板芯片组+无线局域网络模块(内置无线网卡)组成。三件设备缺一或者使用的不是INTEL的牌子那都不称为迅驰,比如最常见的问题是有的机子使用INTEL的CPU和芯片组,但没有带无线网卡,那就不叫迅驰。

但有的人就会受广告的影响觉得带不带迅驰很重要,而不过只是多数情况不过是一块无线网卡的问题,如果没有的话自己加上都可以了。而其中所谓节能的问题不过是一点噱头。

所以本子带不带迅驰这基本没什么影响,少个无线网卡也别认为是赔了,多了也表认为是赚到了,其实都是要核算成本的,一个无线网卡目前市价基本核算在200到300RMB左右。
迅驰是英特尔于2003年3月12日,面向笔记本电脑推出的无线移动计算技术的品牌名称 。迅驰(Centrino)是:Centre(中心)与Neutrino(中微子)两个单词的缩写。它由三 部分组成:移动式处理器(CPU)、相关芯片组以及802.11无线网络功能模块。迅驰品牌 ,是英特尔首次将一系列技术用一个名字来命名 英特尔“迅驰”移动计算技术是新一代笔记本电脑使用的创新技术。用这个技术装 备的笔记本电脑,将使用户脱离缆线的约束,真正做到在移动中进行工作、学习、休闲、上网。从产品实体上看,Centrino移动技术由三部分组成,分别是迅驰技术由芯片组、移动 CPU和无线局域网芯片组成
第一代迅驰技术:2003年3月英特尔正式发布了迅驰移动计算技术,英特尔的迅驰移动计算技术并非以往的处理器、芯片组等单一产品形式,其代表了一整套移动计算解决方案,迅驰的构成分为三个部分:奔腾M(Bannis核心,130纳米制程)处理器、855芯片组和Intel PRO无线网上,三项缺一不可共同组成了迅驰移动计算技术。2004年5月,采用90纳米工艺Dothan核心的奔腾M处理器出现,其二级缓存容量提供到2MB,前端总线仍为400MHz,即Dothan迅驰 第二代迅驰平台——Sonoma2005年1月19日 INTEL发布第二代迅驰平台,该平台由90nm制程的Dothan核心(2MB L2缓存,533MHz FSB)的PentiumM处理器、915芯片组、无线模组Calexico2(英特尔PRO/无线2915ABG或2200BG无线局域网组件)三个主要部件组成。 第三代迅驰平台——Napa基于Intel 945系列芯片组、Yonah核心的Core处理器、Intel 3945ABG无线网卡模块组成的整合平台,相对于第二代迅驰napa平台最大的技术提升有,系统总线速率提升到667MHz,Yonah处理器推出单、双核技术并且采用65nm制程,IntelPro/Wireless 3945ABG无线模块则开始兼容802.11a/b/g三种网络环境。鸡肋版过渡平台——Napa refresh基于Merom核心667MHZ FSB的Core Duo2处理器Intel 945GM/PM芯片组802.11a/b/g网络经测试,napa refresh不论在整体运算性能还是电池续航能力上都未有明显提升第四代迅驰平台:Santa Rosa基于800MHZ FSB的高频酷睿2处理器Intel新一代965芯片组以及802.11n的新一代无线网络,还有迅盘技术(刚上市)第五代迅驰平台:Montevina基于45nm制程处理器Penryn, Cantiga GM/PM芯片组最低支持DX9集成显示单元,HDCP加密支持,HD DVD/蓝光支持以及Robson固态存储技术。 (虚幻啊。。。)



——————————————————————————————————————

3. 64位技术——硬件、平台、软件

很多导购忽悠消费者时就会拿64位说事,什么速度提升一倍之类的,切不可相信。
这里的64位技术是相对于32位而言的,这个位数指的是CPU GPRs(General-Purpose Registers,通用寄存器)的数据宽度为64位,64位指令集就是运行64位数据的指令,也就是说处理器一次可以运行64bit数据。64bit处理器并非现在才有的,在高端的RISC(Reduced Instruction Set Computing,精简指令集计算机)很早就有64bit处理器了,比如SUN公司的UltraSparc Ⅲ、IBM公司的POWER5、HP公司的Alpha等。
64bit计算主要有两大优点:可以进行更大范围的整数运算;可以支持更大的内存。不能因为数字上的变化,而简单的认为64bit处理器的性能是32bit处理器性能的两倍。实际上在32bit应用下,32bit处理器的性能甚至会更强,即使是64bit处理器,目前情况下也是在32bit应用下性能更强。所以要认清64bit处理器的优势,但不可迷信64bit。

AMD把64位技术的概念打了好几年,但市场一直反应冷淡,是为什么呢?
因为64位技术需要三个要素的共同支撑,缺少其中任何一种要素都是无法实现64位计算——
1.硬件:指支持64位的硬件配置,而关键是指CPU。现在市售的主流移动CPU,AMD的sempron闪龙和Turion炫龙系列都加入了AMD的AMD64位技术,支持64位指令集。而关键在于INTEL的,酷睿及赛扬M 4XX系列的都为yohna核心,仅支持32位运算。只有采用merom核心的酷睿2和赛扬M 5XX才加入了INTEL的EM64T技术,实现了对64位指令集运算的支持。

2.操作平台:直白点就是操作系统嘛,一般最常用的WIN XP都只是32位的,虽然MC曾开发过一个64位版的XP,但估计没多少人知道也没多少人使用。。。原因在于大多数软件开发商知道这仅是一个过渡性产品,64位的希望寄托在将来全新架构的vista操作平台上,因此对于64位版XP的软件支持包括驱动支持都少的可怜无法普及使用,这便是这个版本XP没有广泛推广的原因。

当然,全新的VISTA目前早已经上市,这对于64位技术的普及应该说迈了实质性的一步。但一般用户也要学会分清VISTA的若干个版本,比如目前很多市售机型安装的所谓 VISTA BASIC不过只是一个VISTA的32位基础版本,个人认为除了好看点以外并没有多少意义,加之其一大堆的软硬件兼容性问题和系统漏洞,以及同样对于机器配置的较高要求,使这样的系统多少有些沦为鸡肋的意思。。。
当64位平台真正完善起来,64位技术才能真正走向实用和普及。

3.64位软件:只有64位软件才能将硬件利用起来才能实现真正的速度提升。目前很多软件都早已开发了64位核心,就等硬件与操作系统的普及。


. CPU主频

现在很多人买本还留有以前看主频的习惯,殊不知主频飚升的年代早已经过去了,受制于高频高功耗低效率的原因,INTEL这两年也放弃了以往对于主频这一概念的炒作宣传。转而将舆论引导向对于核心数量的关注上,比如单双核。

而大多数人问的最多的便是:“这笔记本就一点几的主频,够用么?”其实并未了解移动CPU和台机CPU的主频由于其架构不同致使其表示值是不同的~

针对这样的一种状况AMD提出了所谓“RP值”的概念,用RP值来作为与以往主频的对比参照,比如sempron闪龙 3400+,1.83的主频,3400+表示的意思就是大致相当于以往3.4GHZ主频的桌面级CPU的运算速度。

所以不用担心什么主频不够高的问题,这是没多少意义的,高主频也代表了高功耗,而且并不是主频高了CPU的运算速度就快,它还受制于多种因素的共同影响。



————————————————————————————————————


5. 售后问题

曾有朋友坚决到国美苏宁买机子不在一般小店买,我问他为什么,他说:“大店售后好,有保障。”

这也是普遍存在的一个误区,现在数码产品尤其是笔记本产品的三包售后已经做的相对很完善了,售后检修工作并不是由经销商来做,而是由专门的售后公司来承包。比如IBM的蓝快维修就是由蓝色快车公司承包的;联想的售后统一叫“联想阳光服务”,但如果仔细的话是会发现一般这之后都会标上地区承包公司的名称;再比如华硕笔记本的售后是统一由海星公司承包的,所以华硕的售后也叫海星维修。

其实经销商只负责从购买日起15天内的包退包换工作,如果出了15天就开始计算保修了,这时如果机子出现硬件问题,是可以自己携带保修卡和购买发票到售后维修的,有些消费者在出问题后将机子交给经销商,经销商也是得送到售后进行检测维修,程序上都是一样的。至于软件问题,还是尽量自己学习解决吧。不会的话找经销商一般都是会给帮忙解决的。

所以其实大店还是小店买,跟售后是否有保障是无关的,不如选个售后相对较好的品牌吧。 一般店大必然成本核算比较大比如人员和店面费用,价格自然下不来,像国美苏宁这样的价格就很高。而小公司尤其是出货量比较大的渠道公司价格就能相对较低。

还有像质量这样的问题在中国全国这个行业都是只要你不懂那就会做些手脚,基本只取决于你的水平和经销商的人品了。大店零售压货较多,样机尾货都照样碰上,至于假的目前有假手机假MP3但还没听说有假笔记本的。。。水货除了IBM和少数几个如东芝SONY等其他牌子几乎都是绝迹的,至少在北京是这样。所以有的担心是没有必要的。





6. 网速问题、稳定性问题

经常有网上的朋友买本咨询我说,就想买个不卡的,上网速度快的机子,要稳定性不能经常死机。
我就回答说上网速度快不快目前跟你机子不会有什么关系,这个是跟你的电信服务商有关…….

至于死机蓝屏或系统不稳定的问题,能说几乎95%都是软件问题,即系统问题,还有病毒和木马的破坏,而跟硬件好坏,或者直接说就是INTEL还是AMD稳定这种问题几乎没关系,跟散热这种问题还是会有关系的,比如商务机的散热都比较好就会相对稳定。

况且即使低端的本比如赛扬M420+GMA950集成显卡 512M内存这种算是比较低配置的机子,我用的就是这种,但我加到1G内存即使打魔兽世界效果全开同时开NN个窗口也很流畅不会卡,那做一般的应用又怎么会性能不够呢?

比较搞笑的是我哥们一万四的IBM R60,酷睿2双核独显的机子,却用着跟爬一样。这才在我好说歹说威逼利诱下重做了遍系统才没问题了。

这说明,好车也要经常上油的,再漂亮的别墅不打扫也会长荒草,电脑也一样,用久了也得经常进行清理维护打扫卫生,比如用WINDOWS优化大师或超级魔法兔子对磁盘进行整理,清理垃圾文件和无效注册表项等等。

而一般机子出现死机以及系统问题更多是由于病毒或木马,选择一个好的杀毒防木马的软件并将病毒库经常更新到最新版本就十分重要。定期经常对磁盘进行扫描以减少病毒和木马对于系统的破坏。像卡巴斯基倾向于查杀国际型病毒,而国内公认最好的是瑞星,企业一般多用诺顿,还有像金山毒霸,360安全卫士,江民等都是不错的。

如果以上这些都不能彻底解决机子的不正常问题,那尝试重装系统或一键恢复也是必要的。如果一个问题在重装系统后不再出现,那几乎就是软件问题而跟硬件无关。我自己的本刚买了就中毒杀不掉,一个星期被我重装四次系统,不要把装系统想成是多么麻烦的事情,只要保证C盘上别有重要数据,像番茄花园SP2的无人职守自动安装(就是传说中的西红柿)这东西还是非常好用的。。。^^





7. 关于各种无线网卡

无线网卡也是个很混乱的问题,很多人都搞不明白。

无线网卡从应用范围上来说分为两种,一种是无线局域网卡,就是一般理解的无线网卡,包括INTEL的迅驰和所谓的802.11a/b/g还有最新的n就是做这种事情的。这种网卡基本就是为了摆脱电线的烦扰,传输距离较短一般在十几米到几十米,需要有一个信号基站如无线路由器进行网络连接,而机子所带的无线网卡是与基站的数据交换用的。
一般在机场,或一些咖啡吧酒吧等都会有无线网覆盖,如果本子有无线网卡就能比较方便地上网。但不是说这么就真的免费,实际上是这些地方缴着网费架设无线基站提供场所吸引消费的。

另一种是无线广域网卡,为的是真正实现笔记本随时随地无线上网。
其实跟手机的信号是一样的,这个现在也分为GPRS和CDMA。
GPRS速度超慢大概只有几KB/秒而且信号不好,一般手机上网用的就是这个。CDMA的信号相对较好速度较快,但也比较贵些,一个网卡目前一般在三百到六百之间,还不包括网费。网费是按包月,算下来一年一般也得八百一千的,目前北京的没有按月收费的最少得按7个月起,大概每月是75块左右,不限流量和时间,但省外漫游的话每月只有5小时的限额,多了的话会另收费。不知道别的地方是怎么算的。
最近听说有个东东叫马赫CDMA无线上网加速器什么的,传说能把CDMA速度提升5倍,没试过不知道什么原理,有兴趣的可以尝试下。

然后还要按接口类型分为三种:一种是内置的,基本只用于无线局域网卡
一种是USB的,插在USB口上即插即用,局域广域都有,这个不用多说。
还有一种是PCI-E插槽的,所有的本子几乎都会有一个5厘米乘8厘米左右的一个插槽,平时里面一般有一个塑料挡风槽,很多人不知道是做什么用的。其实这个就是用来插无线广域网卡的,网卡上一般都会带一个伸缩的小天线,用的时候把天线拉出来就可以随时随地无线上网了。当然前提是你得能忍受它的网速。。。



EXIF版本:0220 设备制造商:NIKON 摄影机型号:COOLPIX L2
光圈:f/3.2 快门:10/601 感光度ISO:50 拍照时间:0000:00:00 00:00:00
[查看该相机参数性能]


8. 过节&促销

我以前也跟一般人想法一样,会期望着并认为过节会降价促销,至少要多送些礼品之类的东西,尤其是笔记本电脑这种大件的数码产品。
但当自己真正做这行之后,终于明白一件事情,就是商家所谓的促销基本都是忽悠人用的。
不理解的话就分析一下,过节时都是消费比较集中的时段,经销商有什么理由自动放弃这样的赚钱机会而主动将价格降下来呢?而且实际的经验是上游厂家在这些时候也并未对价格有什么调整,那经销商更没有资本去搞降价了,尤其在笔记本电脑这样一个市场价格竞争白热化的行业。所以说促销不过是玩的一种手段,送这个送那个,其实都要进行成本核算,赚你钱了才会送你,不赚钱或赚的不多那怎么也不会送你。

还有就是节前买好呢还是节后买好?
根据个人实际经验是节前出手最好。比如过年,年前所有公司都会清仓清库存为的是追现金不把货砸在手里,而有的公司是为了从这行全身而退就要变现,所以这时的市场竞争相当激烈。而有些地方的公司在年底无法完成厂家规定的销售量的话会遭罚金,就会砸价甚至赔本把货发到像北京这种出货量非常大的地方进行销售。因此这时购买数码产品是最好的时段,如果运气好还能碰到血拼价格的。且避免了过节期间的顾客较多价格自然不太好砍下来而服务多少会打些折扣。

但这时各种样机尾货也在急于清掉,因此市场是比较混乱的,买时得擦亮眼睛不能便宜没捡到反而买出一堆问题。

而节后应该说是不怎么好的购买时段,因为过节期间大量出货,很容易使得节后各系列断货,尤其是刚过完年时各品牌都会断货严重,可能你提前看好的机子就包括其中,这样可选择的空间就小了。而供求关系甚至会导致价格不降反涨。


——————————————————————————————————————
9. 电池的使用

对于锂电池包括手机锂电池怎么使用一直说法不一。
但联想在这点上就做的很人性化,在其笔记本电脑的装箱清单中会附带一份电池使用说明。
1.一般新笔记本电脑的电池是有电的,应先耗光余电然后满充满放三次以充分激活后再做一般使用。
2.平时使用时如果机子长时间连接电源而不使用电池,最好将电池取下等用时再安上,这样可以避免因电量自然损减所引起的在满电状态下的不断充放。这对于使用寿命是有影响的。
3.笔记本电脑的电池内通常有一个“计量器”,可以计算电池电力,电池计量器依靠电池的记忆来决定停止充电或放电。定期充放电会保证计量器的准确度,如果经常不完全充电或不完全放电,电池记忆性会被打乱,形成恶性循环,时间一长电池寿命会大打折扣。

为延长电池使用寿命,平时使用时要尽量节省电力,注意做到以下三点:
1. 使用笔记本电脑电源管理功能,使用这些功能将有助于节省电池电力。
2. 液晶显示屏耗电量很大,使用时以视觉舒服为准,尽量将亮度调到可以接受的最低程度,这样可节省大量电力。
3. 从笔记本电脑上拔掉暂时不用的外设,尽量关闭当前不使用的程序,这样可节省电力。
总结点评:笔记本电脑的电池寿命是有限的,保养得好坏与否,电池的寿命肯定是不一样的。由于笔记本电脑电池的价格不菲,动辄上千,希望大家细心呵护自己的本本电池。



—————————————————————————————————————
10. 开不开发票?开什么发票?

引一段经典的对话:
• A:个人购买机器也少有开发票的,有哪个厂家的保修需要发票的?
• B:打官司需要
• A:买机器是为了打官司?
• B:为了防,买保险是为了死人? ?

国家对于笔记本产品的三包规定是:出现质量问题7天包退,15天包换,最少一年保修,重要部件保两到三年。

笔记本有些牌子现在一般没有发票也能保修,但保修时限是从出厂日期开始计算的,有发票就从开票日开始计算。但有的牌子的保修是需要发票的比如IBM,这样是为了防止水货。前边说过,保修时限,这也是整体价格组成的一个重要部分。

很多朋友在买本时会听到说不开票还能便宜保修又没问题,便贪图小便宜选择不开发票或者只开个什么收据。但这样忽略了一个问题,没有发票虽然能保修但却失去了7天包退15天包换的权利! 发票是购销的唯一合法凭证,其他任何票据法律都是不认可的。
换句话说就是不开发票,那本子的质量就得看经销商的人品了。但一般来说还是表因小失大。
而有些牌子的售后维修是需要发票的发票也是作为公民履行依法纳税的义务和责任,不开发票等于在帮销售公司逃税。


开什么发票?


从发票开具方式上现在的普通发票一般分为机打发票,手写发票和定额发票几种。
买本是有机打发票和手写发票两种。定额发票多是用在餐饮上。

而经常遇到的问题是:“发票一定得机打吧?要不手写的有假的怎么办?”
其实发票是机打的还是手写的跟是不是假发票没有直接联系。机打或者手写都是会有真有假的,但一般脑子没秀逗还是想正经做生意的公司是不会用的,因为一旦被税务查了那可是往死里罚。

这里告诉大家两个分辨发票真假的方法。
(1)发票的印制采用数字喷码技术,发票号码可使用印刷专业五倍以上放大镜查看是否成点状分布,如不成点状分布为假发票;
(2)登录北京市地方税务局网站(www.tax861.gov.cn)发票查询模块或拨打声讯电话(010)16881688录入发票号码和密码进行查询,在输入的发票号码和密码正确的前提下,查询系统将告之发票的真假。

还有的朋友问不是说现在都统一用机打的了吗?为什么还有的公司用手写的发票呢?中关村目前的规定是先让所有的含增值税的公司在今年年底前先进入机打发票。现在的普通的纳税公司太多,一下子实现所有公司统一更换是需要时间的。所以目前大多数公司还在用手写发票。大概年底前就能换机打了。

然后从发票的种类上买本时又会分为一般销售发票和增值税发票。
一般购销发票我贴了张图上来,是对于合法购销的凭证。
论坛传图搞的我很郁闷 怎么传到顶上去了。。。

http://up2.zol.com.cn/bbs_upload/upload/2007/05_23/11799166754.JPG


而增值税发票是公司与公司相互进货所开时用作购买方扣除增值税的凭证。一般个人用户是开不了的。某天竟然有朋友拿着这个问我到售后怎么保修~-_-b汗啊


转自orchid

如何选择高“性价比”的笔记本电脑

耐心看完,虽然内容很多会有些晕,但绝对对你起到非常有效的指导作用。这些可是我花了一下午时间打出来的经验总结~

主要内容:

1.所谓的“性价比”都是骗人的

2.不同品牌之间 “性价比”其实都一样

3.选择真正的“性价比”:解析移动CPU

4.另加一条,关于如何选择最适合自己的本


1.很多人在买本时所想到的第一个问题就是哪个本子“性价比”最高。疏不知“性价比”已经成为购机时的一大陷阱。

我向来强调的是“不同品牌之间没有性价比可言”,如果理解不了就拿神舟和IBM对比,但我要告诉你神舟卖那么便宜还照样有钱请李宇春代言,而IBM的笔记本卖那么贵竟然还是亏损的被联想并购了!

所以这其中存在的问题很多。很多消费者在购机时很追这个所谓的“性价比”,要我说其实这东西纯属商家用来忽悠人的概念。

举个例子吧,一个本子,显示屏的成本占到整机成本的四分之一,但有任何一个品牌会告诉你它用的什么档次的显示屏么?可屏也是有质量差别的,比如使用寿命,好的屏比如华硕多用夏普或明基的屏,使用寿命都能达到两三年才变暗,而神舟的屏一般用上一年就会感觉发暗。还有明暗度 可视角度 黑白响应时间及亮暗点率等多种参数规格

比如主板下料,一个DIY高手都会明白好板和渣板在做工下料水平上的差距和因此造成的价格上的差距,虽然用起来感觉不出,但在质量上却是很有差别的。

比如售后服务的成本,经常会有人问我戴尔的看着多么多么便宜,我说你也要能看到DELL所有广告最下面的一行小字“如果想升级至X年售后服务,请加XX钱”,保修时限,这也是价格的一个部分,并且是一个容易被忽略的重要部分。请把这东西加过后再跟别的牌子来做对比。


2.说了那么多,问题在于:“那到底哪个本性价比最高。”

其实并没有所谓的“性价比”,现在笔记本行业的竞争之激烈已经白热化了,其中已经没有虚价的成分,而是“一分价一分货”,不同的价,必然对应不同档次的货。不同的只是各品牌之间注重的东西不同,将成本在不同的方向上进行了不同比例的分配。

比如神舟,国产的牌子其实是不错的,只是稍有反感只做表面上的东西,比如配置会轰的很高,别的任何的牌子都没法比。但笔记本是一个很复杂的东西,不是说配置好的就什么都好了,也应在做工、减少故障率及售后上多做些补充。 所以说神舟是一个极端,有的人不在乎样子只追求花最少的钱买最高的配置的话就会喜欢,而有的人觉得笔记本是用来装点门面的东西就会考虑品位以及使用的质量问题等。所以个人的需求决定了不同的品牌倾向。

再比如IBM,很多人觉得IBM赚死了那么烂的配置居然还敢卖那么贵,T60最低的都没下过1W5,但实际呢?IBM嫌它的笔记本事业部亏损严重没什么前途就卖给了联想。

IBM注重的是商业用户的需求,并不是面向一般上上网打打游戏聊聊天这样的电脑玩家。而是里面的一份资料就会值成千上万甚至千万,那你说他说舍得买笔记本这点钱么?

IBM是将笔记本和西服的制作理念进行了融合,西服要的是什么?要让人显得稳重有内涵,并且体面耐脏耐折。想想IBM那一惯的全黑形象就应该能明白了吧。而SONY面向时尚的路线决定了它的产品颜色丰富多彩。

但样子只是表面,IBM这样的商用机更重要的东西在于它的内涵,说过它可不是用来打打游戏看看电影的,它的很大一部分研发资金投入在了“数据安全性”上,比如ASP硬盘防护,全铝镁防滚架,甚至是蓝色快车的行业内令人称道的优秀售后服务,还有很多人只要看了都会惊异的IBM的笔记本研发实验室。

好车为什么贵?是因为在对车内乘客的安全保护上下了足够多的工夫,任何一个型号的奔驰在上生产线前都会在实验室里被用来做无数次撞击实验,接受各种磨砺和检验。我想神舟可不舍得把个新本子就像IBM那样拿来摔摔打打吧。所以这也是IBM价格组成中为了提高其数据安全性的很重要的一个部分。

要知道你手上拿着IBM和你穿着阿玛尼可是一个概念。

所以每当看到小女生用着IBM聊QQ我就特崩溃-_-!!!~

那其他牌子呢?其他牌子只是介于类似神舟和IBM之间,对配置、质量、售后、还有其他一些因素进行了不同的倾向和调整。但实际上任何一个牌子,便宜是有便宜的理由,贵也都是有贵的理由。买与你所注重的东西相同的品牌,才是真正最合适的。

但我也要提到不要轻易对任何一个品牌进行否定。要知道笔记本两年内的行业平均返修率接近四分之一,即使是排名第一的富士通(日货。。。。)也仅做到了8%。所以说买本这事本来就是拼RP的,RP好了神舟用着照样爽,RP不好了买个IBM也能让你恨的要死。

3.其实性价比是存在的并且有方法去找寻的,下个定义就是:价格及配置是否与个人使用要求相符合以及其潜在价值的大小。

简单的说就是买最适合你的,并且知道怎样去淘到真正有潜力的东西,其实就是在为自己省钱。
那什么又叫做真正的“性价比”呢? 其实真正的“性价比”基本只跟CPU挂钩。而跟硬盘、内存之类乱七八糟的东西通通无关,硬盘不够是可以换的,内存不够是可以加的,但CPU选的不合适那就是在浪费钱。而显卡只占一小部分的原因。

比如目前遇的最多的就是买哪种CPU,有钱的都会去买酷睿2的,那是因为人家有钱,没钱的比如我就买的单核赛扬集显了。但卡在中间的就会头痛买什么好,酷睿双核还是AMD炫龙双核?其实单就目前的使用性能来说,NAPA平台的酷睿CPU是“性价比”最高的,十分实用而且INTEL在不断清仓降价。酷睿2要比酷睿同性能的贵近千,并且卡在了945主板的瓶颈上,性能其实并没有实质性提升。

与酷睿同价位的是AMD的炫龙双核,价格差不多,目前的性能测试的结果也差不多,很多人就会有个品牌倾向性因为INTEL打广告的水平和能力着实让全世界人民佩服,可很多人忽略掉一个关键性的问题:潜在性能。要知道酷睿只是32位的,而炫龙却是64位的,虽然在目前普遍的32位平台上俩的性能几乎一样,但我说只需要一年时间,或者一年都用不了,半年吧,等VISTA遍地的时候,你就会发现一个尴尬的问题:酷睿只能用VISTA 的32位版本,这种提升近乎是没什么意义的,而炫龙双核把内存加大后竟然能流畅运行VISTA的64位版,这种差距是不言而喻的.

那么这就是所谓的潜在价值。而要发现它就需要个人对技术和市场的经验和实力了^^

说说“性价比”的排行,拿这个可以作为所有本子的参考:

排倒数第一个的个人认为就是酷睿2CPU的本了,尤其是T7XXX系列的更是完全没必要,不止是主板限制的原因,而且必须考虑“水桶效应”的原理,我认为CPU这几年始终是突的最高的那块板子,而其他一些东西比如硬盘接口速度、内存大小都比这CPU对整体性能的发挥重要的多的多的多。所以如果从省钱的角度考虑,第一个该砍掉的就是高档CPU。

而酷睿的性价比目前还是要比酷睿2高些的,因为其性能在XP和945板子的环境下能达到一个很好的整体平衡。只是如果就长远来考虑也就是64位的VISTA系统应用的话,它还是无法和AMD的炫龙双核比的。

很多人问我酷睿和炫龙哪个好,我说AMD的性价比要比INTEL差,那它就甭混了~事实如此,AMD多年来一直是在INTEL在全球一手遮天的环境中逐步成长起来的,到现在敢叫板INTEL,它靠的就是与INTEL相比更高的性价比。尤其是炫龙双核对未来应用的潜在影响力,是酷睿所无法比拟的。

性能上,炫龙双核要比酷睿高一个等级,但仍与酷睿2有一点差距。

接下来提个问题:“你七年前用电脑做什么?现在用电脑做什么?”七年前我自己用着奔腾3,64M内存的机子打帝国2、KOF97,用着micro office 2000打字做文档,用IE4.0逛网站,用着QQ聊天。

现在呢?我还在打着帝国2和KOF97(别骂我 谁让这东西太经典了),一样用着office 2007打字做文档,用着IE7.0逛网站,还有QQ2007。。。

所以这使我很坚决的把刚买了一个月的华硕M9J双核+独显的机子折了很多钱卖人了,换了个赛扬M430+GMA950的联想E290,把内存从512加到1G,开WOW的同时开着N多个QQ窗口和网站,照样一点也不卡。却省下两千多块拿来做什么不行啊

配置这个东西如果实力不够有时还是没必要追那么高的,有多少钱做多少钱的事,现在花五千买个配置一般的机子,大不了用上两年把这个扔了再花五千买个新的,用着也绝对比现在花一万的划得来。

所以我说就一般用户的话单核的还是比双核的性价比高多了,只要别追VISTA“喂死它”。

SO,还有个建议是有多少预算就别全花掉,留出几百把512M内存提升到1G,绝对比把这个钱投在整机里对使用性能提升的效果要好的多明显的多。

4。另加一个内容,关于如何选择适合自己的笔记本:

其实买本这事也不用搞这么复杂,只要把握住四个东西就能找到最适合你的笔记本,从而卡在具体的一到两个型号上:价位、品牌、对配置的要求和尺寸。有问题的告诉我你对这四点的要求,越详细越好,我就能参考帮你从无数品牌中找到最适合你的那个本了

而这四点是互相制约的关系,以品牌为前提,确定其他三点中的两点,那剩下那个也就会是确定的。

举个例子吧,曾有朋友想买华硕,就问我6千左右的怎么样。这样就确定了两点,我就告诉他 在这个价格档位,华硕可以买到单核+独显 15尺寸的如A6Q44CJC;或者单核+集显14尺寸的Z99HT36M-SL,如果想要双核+独显的那就得把价位上调最少六百到一千左右如A6Q22JE

可能很多人会不明白为什么“尺寸”也会算在其中?孰不知笔记本这东西是越小越贵的,每小一个尺寸,价格就会飙升近千因为它有一整套的设计技术和设计精度在里面。
很多人就在这上面被JS忽悠了,说什么“大的看着爽快”“大的用着舒服”然后一被黑就最少几百上千

SO,这些就是我总结的一些东西,可以简称“O氏定理吧”呵呵
为自己挑选适合的本就可以通过这四点去把握而不要听JS所谓“性价比”的言论,你看好哪个就买哪个,坚决不能被转型!

我花一下午时间打的长篇大论终于写完了^^ 希望对所有要买本的朋友们都有用~

转自orchid

星期五, 五月 18, 2007

手机被偷后如何让小偷不能用

所有的手机都有一个惟一的序列号,当你键入*#06#时,你手机的屏幕上就会出现一个15位的数字,这个数字就是你的手机的序列号。请把此号码记下来并保存好,当你的手机被盗后就可以将此号码提供给你的服务商[中国移动][中国联通],他能将你丢失的手机锁住,即使别人将你原有的SIM卡换掉,此手机也不能使用。也许你不会失而复得,但是你的手机对他们来讲也是没有任何价值,除非将它作为纸镇。如果每个人都能够知道自己手机的惟一的序列号,那么盗窃手机将变得没有任何意义。将这个信息告诉尽可能多的人,这个常识普及了,大家丢手机的机会就少了!!

星期四, 五月 17, 2007

百度在线笔试的答案

1, 一个文本文件有多行,每行为一个URL。请编写代码,统计出URL中的文件名及出现次数。
a) 文件名不包括域名、路径和URL参数,例如http://www.rs.com/n.op/q/rs?id=1中的文件名是rs。
b) 部分URL可能没有文件名,例如http://www.abc.com/,这类统计为“空文件名”。
c) 出现在不同URL中的相同文件名视为同一文件名,例如http://www.ceshi.com/hi.php
和ftp://ftp.cdef.com/hi.php为同一文件名

文件内容示例如下:
http://www.test.com/abc/de/fg.php?id=1&url=http://www.test.com/index.html
http://www.ceshi.com/hi.jsp
ftp://ftp.ceshi.com/hi.jsp
http://www.hello.com/cw/hi.jsp?k=8
http://www.hi.com/jk/l.html?id=1&s=a.html
http://www.rs.com/n.op/q/rs?id=1
http://www.abc.com/


2,一个简单的论坛系统,以数据库储存如下数据:
用户名,email,主页,电话,联系地址,发帖标题,发帖内容,回复标题,回复内容。
每天论坛访问量300万左右,更新帖子10万左右。
请给出数据库表结构设计,并结合范式简要说明设计思路。


3,现有两个文件,
a)数据文件A,格式为:关键词、IP地址、时间,记录条数为1000万左右,该文件是无序排列的。
b)数据文件B是关键词ID到关键词的对应表文件,格式为:ID、关键词,记录条数在100万左右,也是无序排列的。该对应表中的记录是一一对应的,不存在ID或者关键词重复的情况。
要求将数据文件A对应的关键词替换为B中的ID,生成新的数据文件C,数据文件C的格式为:关键词ID、IP地址、时间。
请设计一个程序,实现上述功能,并分析时间复杂度和空间复杂度。运行程序所使用的服务器的内存为1G,硬盘足够大。(至少要给出关键算法和设计思路)

呵呵 发现在csdn有篇帖子上引用了我的这个.所以丢着这个成年没写完的东西是在是丢人.我还是把这个答案写完吧.给大家一点提示

1.此处主要是考核对正则的操作能力.其实无论用什么语言.这个用正则是最好的.所以我当时认为这个是最简单的.可以说你只要写出正则表达式即可.我写得是"|\/([^/]*?[^\?\/]{0,4})(\?.*?){0,}$|i"这个正则描述是php.

以下为java代码(嘿嘿...毕竟java才是偶地擅长)

/**
*
*/
package javaText.test;

import java.io.File;
import java.io.FileInputStream;
import java.io.FileNotFoundException;
import java.io.IOException;
import java.util.ArrayList;
import java.util.Hashtable;
import java.util.List;
import java.util.Map;
import java.util.regex.Matcher;
import java.util.regex.Pattern;


/**
* @author Administrator
*
*/
public class Test {

/**
* @param args
* @throws FileNotFoundException
*/
private final static String UrlPattern = "/([^/]*?[^\\?/]{0,4})(\\?.*?){0,}$";
public static void main(String[] args) throws Exception {
String a = "d:/a.txt";
StringBuffer strbuff = new StringBuffer();
byte[] temp = new byte[1024];

try {
FileInputStream stream = new FileInputStream(new File(a));
while(stream.read(temp)!=-1){
strbuff.append(new String(temp));
temp = new byte[1024];
}
} catch (IOException e) {
// TODO Auto-generated catch block
e.printStackTrace();
}

List list = getMatchList(UrlPattern,strbuff.toString().trim());
Map count = new Hashtable();
for(String tempString :list){
if(tempString!=null)
tempString = tempString.trim();

if(count.get(tempString)==null){
count.put(tempString, 1);
}else{
int i = count.get(tempString).intValue();
count.put(tempString, ++i);
}
}
System.out.println(count);
}
public static List getMatchList(String pattern,String PatternTarget) {
Pattern p = Pattern.compile(pattern,Pattern.CASE_INSENSITIVE|Pattern.MULTILINE);
Matcher m = p.matcher(PatternTarget);
List list = new ArrayList();
while (m.find()){
list.add(m.group(1));
}
return list;
}
}
}

2.此题主要是考核web设计中面临数据量较大的表设计
我以mysql为例来设计表(呵呵,最近用得最多)
用户名(username),email(mail),主页(homepage),电话(tel),联系地址(address),发帖标题(title),发帖内容(context),(回复标题(),回复内容)实际上是对应于发帖的。
由于数据并发量较大.所以表需要尽可能的减少表查询量.我的设计如下

user表
create table usertable{
id int(11) auto_increment,
username varchar(255),
mail varchar(255),
homepage varchar(255),
tel varchar(255),
address varchar(255),
primary key(id),key(username)
}
alter table usertable add index id_idex(id);//给id建立索引
alter table usertable add index username_idex(username);//给id建立索引

帖子表.其中的用户信息是和user表的用户信息同步.这样保证了查询表的次数
create table posttext{
id int(11) auto_increment,
title varchar(255) not null,
context text ,
user_id int(11),
username varchar(255),//此处需要加入页面显示的基本信息.这样每个帖子的查询就只需要涉及一个表的操作
mail varchar(255),
homepage varchar(255),
is_topic enum(1,0) default 0,
primary key(id)
}
alter table posttext add index id_idex(id);//给帖子id建立索引
alter table posttext add index id_idex(user_id);//给用户表id建立索引


3,现有两个文件,
a)数据文件A,格式为:关键词、IP地址、时间,记录条数为1000万左右,该文件是无序排列的。
b)数据文件B是关键词ID到关键词的对应表文件,格式为:ID、关键词,记录条数在100万左右,也是无序排列的。该对应表中的记录是一一对应的,不存在ID或者关键词重复的情况。
要求将数据文件A对应的关键词替换为B中的ID,生成新的数据文件C,数据文件C的格式为:关键词ID、IP地址、时间。
请设计一个程序,实现上述功能,并分析时间复杂度和空间复杂度。运行程序所使用的服务器的内存为1G,硬盘足够大。(至少要给出关键算法和设计思路)

这个程序主要考察的是大容量数据的查询 以及操作..
一般的机器100万的数据打开就很吃力了.何况1000万

如果是我选用的话.那么1000万肯定是做为分段取的一种.
首先肯定会用shell的split拆分它.我觉得拆分为10w一段的去取即可

另外100万的那个文件应该分拆为多个索引数据.
可以采用id分段.比如1-1w分为一个区间段.分拆为100个文件.每个文件保存相对应区间的id记录.这样就可以大大减少查询量 和读入空间.
这类操作最好是采用shell 写因为shell的数据追加比较好..利用awk和sed进行数据操作..嗯~~得查参考书了..shell虽然好用.但是麻烦..


思路(shell和perl都是翻书做,那东西太麻烦了,我基本上是今天写明天忘.写思路好了)

索引文件建立
确认区间段1w一个
这样的话1-100w 分别是1...100w
这个就容易多了.当作文本处理.文本长度为多少位.根据最大位做判断.如果是1 则判断其他位.(好像还是不完美....) 理论上来说 应该有数学方法可以判断得更加完美.可惜..回头再查查

split -10000 ./file //这个写的时候有待商酌,因为文件比较大.会不会太慢.如果慢的话.用more带参数循环处理好了,反正文件的行数大致能知道.那么就有点不太完美...
awk 截取出$1 进行判断.根据判断 取对应的文件循环我们的索引文件.得出结果返回.
累加到新文件

window删除服务的命令

window删除服务的命令:
cmd 下执行 sc delete [服务名称]

jforum论坛 筐架介绍

JForum开发框架介绍
JForum是著名的开源论坛,支持多达数十种的多国语言,其中包括简体中文(管理界面没有完全汉化)。JForum功能强大,界面美观,加上代码结构清晰,而且采用的是BSD授权,不必担心不必要的版权纠纷。可以说JForum是论坛二次开发的绝佳选择。
JForum采用的是自己的MVC框架,因此在初次接触的时候可能会有些不习惯,但在熟悉后,该框架还是很容易使用的。在这里只是对JForum的框架进行简单的介绍以利于利用JForum进行二次开发,具体的细节请参考JForum代码。
JForum的MVC框架有些类似Struts。
先看请求的url地址/bbs/jforum.page?module=recentTopics&action=topRep_Topics_thisDay。
首先在在web.xml中配置过滤器,将所有以.page的请求交给net.jforum.JForum统一处理转发。请求在交给JForum后,JForum要获取传递过来的一些参数从而决定由哪个模块来具体处理请求。参数module,决定由哪个模块来处理。model的名字和具体class的对应关心在配置文件modulesMapping.properties里进行配置。当前操作由具体的哪个函数处理由action参数指定。action就是要执行的方法名,在无法找到指定处理方法时执行list方法。在处理完请求后,调用this.setTemplateName(TemplateKeys.SSOEXT_TOPREPMSGS_PERDAY);方法设置返回页面。其中页面和页面名称的对应关系在templatesMapping.properties中设定。
再简单的介绍一下JForum新增功能的开发流程。新建一个Action继承Command。在配置文件中modulesMapping.properties中增加新建立Action的对应关系。实现Command中定义的list方法,完成在未指定action情况下的默认操作。在templatesMapping.properties中增加返回页面的对应关系,在类TemplateKeys里增加返回页面和templatesMapping.properties配置文件里的对应关系。利用this.setTemplateName(TemplateKeys.RECENT_LIST);设置返回页面。
JForum默认采用的是FreeMarker作为表示层,但如果对FreeMarker不熟也可以采用jsp做为表示层的实现。