老头也不管我,拿起笔记本,仔细地看了起来。</p>
我心想,要说服他来帮我就好了。</p>
突然,我想到昨晚的梦,虽然也不是特别明白梦里到底是说了哪些代码,但是豁出去了:“就像下围棋,围棋是策略类的对弈游戏。首先是要给围棋设定一个初始的判断,收集很多人类的玩法,然后从所有的可能的落子当中选择一个最有赢面的落子;接着是判断每一步的格局变化,判断出现在自己的处在的优劣形式;然后再是函数分析,通过模拟落子来达到预期的成长。”</p>
说完我发现老头非常讶异地看着我:“你是怎么知道这些的?!”</p>
“嗯——我也挺……”我想说我也挺迷惑的,但是因为是硬着头皮说,所以脑子里只是有点概念。</p>
“你说的非常对!只要让它踏上第一层台阶就能让它自己成长起来,学习只是一种激励模式。”</p>
“激励?”</p>
“是啊,究竟什么叫学习呢,你觉得?我想你应该可以想得到。”老头非常满意的表情让我有点自信了。</p>
可是我并不知道学习究竟是什么,只好猜一个最有可能的。假设我平时学会一个东西时,总是先看人家在做什么,人家是怎么做的,然后模仿他们,这应该就是模拟。我刚想说“模拟就是……”,转念一想不对,总觉得机器模拟人会有问题,因为如果机器模拟人的行为,就是拍个照片,然后玩“大家来找茬”,那还叫什么模拟?那我究竟是怎么学习的?一定是哪一个关键点被我忽略了。</p>
我看一眼教授,他脸上的表情从满意变成了期望。这表情就像我小时候满心期待地等大人给我买一支冰淇淋蛋筒的眼神。</p>
是啊,每个小孩都要妈妈的奖励,才能成为大人。</p>
每个小孩从小都一样,都是妈妈告诉我们这个好,这个要多做;那个不好,那个要少做。然后我们照着妈妈的话做了,我们得到的是一张慈爱的笑脸;而当我们没有按照妈妈的话做时,我们将会得到一张阴沉的脸。</p>
所以,这个词叫什么?奖励、惩罚,这个机制叫什么?……叫反馈。</p>
“反馈。”我压低了声音说。</p>
老头把笔记本合上,往桌上一拍:“对,就是这个!你是个聪明人,这么短的时间,竟然知道了我几年才知道的那个问题的答案。”</p>
听到这话我才放松下来。</p>
老头把笔记本递给我说:“你应该拥有这本本子,拿去吧,拿去看看。这上面有你要的东西,当是送给你的礼物。”</p>
“这怎么可以,我才见了你两次,这本是你私人的记录,记了很多年的笔记,怎么能给我?”</p>
“它正是记了多年的笔记,才需要一个更适合拥有它的主人。”老头表情松弛下来,撑起桌子,拿上杯子,站起身来,“我也没多大志向了,毕竟这么大的年纪,63了,年轻时候拼命努力,只知道工作。你看这书柜,其实在很多人眼里一个孩