欧美国产调教一区二区_国产精品电影在线免费_亚洲成亚洲成网tv_一区二区三区国产在线

算法的進化:機器會引發(fā)戰(zhàn)爭嗎?

時間:2021-05-25 14:02:10

導(dǎo)語:現(xiàn)代算法是可以自學(xué)的,尤其是推薦系統(tǒng)算法,它可以根據(jù)每個人的喜好推薦有趣的東西給我們,比如說適合的電影、書籍、音樂等等。

現(xiàn)代算法是可以自學(xué)的,尤其是推薦系統(tǒng)算法,它可以根據(jù)每個人的喜好推薦有趣的東西給我們,比如說適合的電影、書籍、音樂等等。算法通過與用戶之間的交互過程,獲取用戶的個人偏好信息,并從中學(xué)習(xí)進一步完善自身,發(fā)現(xiàn)其中的關(guān)聯(lián)關(guān)系,以便為下一位用戶提供更優(yōu)質(zhì)的推薦信息。為了滿足自己的好奇心,我研究了其中一種算法,想知道它到底能有多了解我。所以,在劍橋微軟實驗室測試Xbox游戲機所用的Kinect視覺識別算法時,我順便拜訪了一位同事,想向他了解一個實時推薦系統(tǒng)的算法原理。

該推薦系統(tǒng)的用戶界面上隨機排列了約200部影片,我要做的是如果看到自己喜歡的影片,就把它拖放到屏幕的右側(cè)。其中的確有一些是我比較喜歡的影片,于是,屏幕中的影片位置自動調(diào)整,將我可能喜歡的電影放到靠右側(cè)的位置,而將我可能不太喜歡的電影放到靠左側(cè)的位置。僅僅通過一部電影是不足以訓(xùn)練算法的,所以大部分尚未被分類的影片仍然停留在屏幕中間的區(qū)域。

《王牌大賤諜》這部影片我覺得很無聊,屬于我特別不喜歡的類型,所以我就把它拖到了屏幕左側(cè)的回收站里。這一操作為算法提供了進一步學(xué)習(xí)所需的新信息,使屏幕中影片的位置又進行了一次調(diào)整,我似乎能感覺到算法對自己提供的建議很有信心:它將伍迪?艾倫(Woody Allen)的《曼哈頓》推薦為我喜歡的電影。這部影片確實是我喜歡的,盡管算法是對的,但此時它還沒有給我特別多的驚喜。它可能覺得我會比較喜歡《搖滾萬歲》,所以將這部電影向右側(cè)移動了。但事實恰好相反,我不能忍受這部影片,所以我把它拖到了回收站里。

算法本來以為我會喜歡《搖滾萬歲》,但事實上我不喜歡,從這個過程中它獲取到了重要的新信息。屏幕上的影片又一次進行了重新排列,并且此次調(diào)整的幅度非常大。這是因為系統(tǒng)后臺的算法程序發(fā)生了微妙的改變―它根據(jù)我此次的選擇學(xué)到了更多的“新知識”,并微調(diào)了推薦系統(tǒng)的模型參數(shù)。它判斷我可能喜歡《搖滾萬歲》這部影片的概率過高,所以通過修正特定的參數(shù)來降低其值。雖然此前它從別的既喜歡韋斯?安德森又喜歡《曼哈頓》的那部分影迷處得知,他們也喜歡《搖滾萬歲》這部電影,但這一條并不適用于我。

正是這種人機交互給算法提供了持續(xù)學(xué)習(xí)的新數(shù)據(jù),使它可以不斷進行自我調(diào)整以適配我們的喜好。在當(dāng)今社會,這些算法在我們做出各種抉擇時發(fā)揮了巨大作用:選擇電影、音樂、書籍,甚至伴侶,等等。

如果你喜歡……

電影推薦系統(tǒng)的算法原理比較簡單。假定你喜歡電影A、B和C,而另一個用戶也喜歡它們,但他還喜歡電影D,那么,D極有可能也是你所喜歡的。當(dāng)然,現(xiàn)實中數(shù)據(jù)之間的邏輯關(guān)系并非如此簡單。你喜歡電影A、B和C是因為這些影片里有你最喜歡的某位演員,但他并沒有出演D這部電影。而另一個用戶之所以喜歡A、B、C、D四部電影,是因為它們都是驚險刺激的間諜電影。

算法通過查看你所提供的信息,分析出你喜歡某類電影的原因,進而會把你和那些曾經(jīng)做出過相同選擇的人匹配、關(guān)聯(lián)到一起。算法需要在大量的初始數(shù)據(jù)樣本基礎(chǔ)上展開工作,這一點跟許多機器學(xué)習(xí)算法是相同的。機器學(xué)習(xí)的一個重要特點是,人類必須參與到數(shù)據(jù)的分類過程中,以便讓機器知道它所看到的到底是什么。這種管理數(shù)據(jù)的行為為算法提取潛在信息的模式做好了提前準(zhǔn)備。

算法在用戶瀏覽影片庫的行為過程中拾取關(guān)鍵特征值,如浪漫愛情喜劇、科幻片,或者是某位演員、某位導(dǎo)演的作品。但是,這種方法并不理想。首先,非常耗時;其次,分類的過程存在不客觀因素,計算機最終學(xué)會的是已知的知識,而不能發(fā)現(xiàn)新的潛在趨勢,從而導(dǎo)致計算機形成擬人態(tài)的思維定式。從最原始的數(shù)據(jù)中學(xué)習(xí)并發(fā)現(xiàn)模式是訓(xùn)練算法最好的方式。

大家都知道,Netflix公司是一家會員訂閱制的流媒體播放平臺,開發(fā)出自己的電影推薦系統(tǒng)后,在2006年舉辦了奈飛大獎賽,期望通過競爭來發(fā)掘最優(yōu)的算法。當(dāng)時,Netflix已經(jīng)積累了大量的電影評級數(shù)據(jù),評分等級分為1~5星。于是,它公開了一個包含100 480 507個元素的電影評級訓(xùn)練集合,這些元素取自480 189個用戶對17 770部電影的評價。然后,Netflix將17 770部電影的名稱替換為數(shù)字序號,即變?yōu)槟涿麪顟B(tài)。比如,2666代表的可能是《銀翼殺手》,也可能是《安妮?霍爾》,或其他任何一部影片。只有用戶給這部電影的評分是已知的。