第784章 计算机学习(第2/3页)
作品:《大时代之巅小说免费阅读》我知道这是未来。”
“好答案。”
沈向阳忍俊不禁。
周不器缓缓的道:“不知道许亮杰跟你说没说过,紫微星目前有两个内部项目,也属于人工智能的范畴。”
沈向阳道:“他没跟我谈业务的事。”
周不器点了点头,“嗯,这算是公司机密。我跟你说说。其中有一个项目,是个性化的内容分发,根本不同的用户信息,来通过信息流的方式分发相应的广告和内容。”
“朋友网的广告?”
“对,主要是今日头条,这是我们内部的一个项目,9月份会上线,会有内容的分发。”
周不器就简单的说了一下今日头条内容分发的理念。
沈向阳略作思考,沉吟道:“如果是这种模式,简单的个性化分发是不够的,这不够精确。必须要有更复杂的算法支持,这需要使用到深度的计算机学习。”
“什么说?”
“嗯……”
沈向阳有些头疼,他最烦跟外行探讨深度的技术问题,可对方是老板,又不能不解释,想了一下,说道:“这样,你问我5+5等于几。然后我模拟计算机,给你解释一下。如果我说错了,你要给出正确的答案,然后多问几遍。”
周不器觉得挺有趣,笑道:“行,那我问啦。咳咳,5+5等于多少?”
沈向阳道:“88。”
周不器微微一愣,明白了他的意思,帮他改正,“不对,是10。5+5等于多少?”
沈向阳道:“24。”
“不对,是10。5+5等于多少?”
“17。”
“不对,是10。5+5等于多少?”
“12。”
“不对,是10。是5+5等于多少?”
“10。”
“对了。5+5等于多少?”
“10。”
“5+5等于多少?”
“10。”
沈向阳做出了这个解答,然后接结束了这个问题,“这就是机器学习的逻辑。当然不是算术了,而是计算用户对广告或者内容的喜好度。其实针对广告的个性化投放,不能根据广告本身,而是根据内容。朋友网的个性化广告我看了,主要就是根据用户的个人信息,这略显粗糙,准确率也不高。”
“那应该怎么做?”
“通过机器学习,把广告和内容捆绑。比如阅读内容A的用户,都喜欢广告A,两者就可以对接了。这个比较简单。更复杂的是内容投放,要结合统计学习和神经网络,通过机器学习,让计算机学习用户的阅读习惯。就像刚才的算术题一样,一开始,错误率比较大,越是学习,错误率就越小,就越贴近正确答案,即用户的阅读习惯。”
周不器不太服气,透露了点小秘密,“朋友网的个性化广告分发算法,是Facebook做出来的呢!嗯,我们是合作伙伴。”
“这样啊……”沈向阳笑了笑,“Facebook的技术也不怎么样。”
“呃……”
口气真大!
好吧,这哥们的确够资格讽刺Facebook技术差。
周不器接着说:“还有一个项目,我们都做了半年了,一点头绪都没有,我们派出了一个很厉害的技术大牛,叫徐铭,他也没办法。他本来是搜索事业群的技术总监,不过项目没进展,接下来就把他调进研究院,你来带吧。”
“什么项目?”
“智能搜索,个性化搜索,千人千页。”
其实就跟个性化内容推荐差不多,不同的是,这次是针对搜索结果的个性化推荐。
沈向阳脸色就凝重起来,“这可难多了!比那个朋友网的个性化广告,今日头条的个性化内容都难。”
“是吗?不都是个性化推荐吗?”
“级别不一样。”
“嗯?”
沈向阳解释道:“技术难题往往是两点,一类是复杂度,一类是规模量。比如Photoshop、MATLAB这种工程软件,就是太复杂了,我们国内做不出来。规模量指的是数据多少。一个算法,处理小数据时可能很奏效。可是涉及到大规模数据,算法就失效了。就像手工制作和机械化批量生产一样,没有可比性。”
周不器点了点头,“嗯,大数据。”
沈向阳道:“大数据算法是一套,个性化算法是一套,大数据下的个性化算法,又是另外一套。这并不是简单的1+1=2的关系,需要从算法框架方面有更优化的设计。智能搜索这个概念前两年就提过了,可是做不到。”
现在,全世界连大数据都没搞明白呢,对大数据下的衍生算法,更是想都别想。
这么一看,还是老沈技术更高、视野更广、认知更清楚啊!
智能搜索这个项目,是许亮杰、程秉皓、王小船和徐铭共同决定的,觉得这个方向大有可为。可沈向阳却给否了,说