最近有一类帖子刷屏了:搜索雪白、鲜嫩时,百度搜索到的是清凉美女,而谷歌搜索到的是雪景和食物。对于这种搜索水平的差异,我很早就意识到了。最近几年讲大数据,我常用一张PPT比较“宝钢 郭朝晖”的搜索差异(我当时还在宝钢工作)。我常会对学员说:这就是智能和智障的差异。
对于这件事,有知情人士这样为百度开脱:
一开始搜“嫩滑”,百度确实出性暗示结果。但这个不是百度的引导,而是中国用户确实最多点击那些性暗示结果,百度系统习得数据而成。谷歌中文的搜索结果清新,也许正因其中文数据库的稚嫩。机器学习学的是用户行为,在此事上,不是百度色情,而是上百度反应出了真实的人类数据。Google进中国之后,机器学习也会越来越色情。
百度怎么会搜到雪白的美女了呢?简单地说,就是根据搜索量来的:如果一个词在两篇文章中出现,一篇文章被搜索了1万次,一篇被搜索了1次。则搜索引擎会把搜索1万次的文章或者图片推送给你。因为人们点击的、带有“雪白”的文字中,更多是美女的照片。所以,百度就把美女推送出来了。
但是,把责任推给网民是不合适的。
对人工智能感兴趣的人都知道,谷歌在人工智能领域非常领先。这其实是有基因的。谷歌创立之初,投资人问他们:现在搜索引擎这么多,你们为什么还要搞? 结果得到的回答是:我们搞的不是搜索,是人工智能!
按照我的理解,所谓的“智能搜索”,首先要“猜”的就是用户输入要搜索的文字时,到底想看什么。显然,多数人搜索“雪白”时,想看的应该是雪景——如果要看雪白的美女,不如直接搜“美女”,谁会搜索“雪白”呢? 所以,智能的推送应该考虑更深层的逻辑:对那些更可能用其他方式搜索的文章或图片,应该降低其优先级。
如果有人把“吃饭”理解为吃“米饭”、把“读书”理解为“念课文”,大家会觉得这人有点智障。所以,智能和智障的差异,往往就是理解“内涵”和“字面”的差异。百度创立了这么多年,还只停留在搜索次数排序,却没学会猜测用户的意图,距离“智能”的要求确实远了点。李彦宏还想“再赢一次谷歌”,大概也只能继续用下三滥的办法了。
写到这里,突然想到昨晚看到的一个报道:贪污了2.7个亿的华融集团董事长赖小民,去年接受中央媒体采访时,却强调自己如何学习党的文件。我突然困惑了:这样的人,到底是智能呢,还是知障?
更多关于材料方面、材料腐蚀控制、材料科普等方面的国内外最新动态,我们网站会不断更新。希望大家一直关注中国腐蚀与防护网http://www.ecorr.org
责任编辑:韩鑫
《中国腐蚀与防护网电子期刊》征订启事
投稿联系:编辑部
电话:010-62313558-806
邮箱:fsfhzy666@163.com
中国腐蚀与防护网官方 QQ群:140808414
免责声明:本网站所转载的文字、图片与视频资料版权归原创作者所有,如果涉及侵权,请第一时间联系本网删除。
官方微信
《中国腐蚀与防护网电子期刊》征订启事
- 投稿联系:编辑部
- 电话:010-62313558-806
- 邮箱:fsfhzy666@163.com
- 中国腐蚀与防护网官方QQ群:140808414