2
本文作者: 老王 | 2017-02-13 20:17 |
雷鋒網(wǎng)按:百度搜索在近日推出了基于人工智能技術(shù)的“情人節(jié)用臉撩,開啟桃花運”功能,迎接情人節(jié)。
用戶在百度搜索 App 中需用語音說一句“開啟桃花運”即可進入主題頁面。該頁面包含兩大核心功能,一個是“自拍撩漢/妹指數(shù)”,另一個則是輸入姓名和地名自動生成專屬詩歌。
第一個顏值打分功能其實較為常見,雖然百度尚未對其進行詳細介紹,但雷鋒網(wǎng)了解到常見的基于監(jiān)督學習顏值算法大致原理如下:
首先選擇一組人臉特征:如眼間距、膚色、眼睛、鼻子、嘴巴尺寸等等,隨后建立人臉識別算法,給定一張人像可自動計算上述人臉特征。采集大量人臉樣本,人肉標記每張臉的顏值得分,然后向量化用 SVM 等方法建立模型。
隨后需將帶有顏值得分的人臉樣本隨機分成 1、2 兩組,用 1 組圖片經(jīng)過特征提取來訓練機器學習算法,進行調(diào)參,使得算法輸出的分值盡量接近人工打分的結(jié)果。并用 2 組圖片進行驗證,看看算法對不包含在 1 組中的圖片是否能正確計算出結(jié)果。
訓練結(jié)束后即可用來給人像打分。
目前市場上不少 AI 文學創(chuàng)作產(chǎn)品自于預設(shè)的文本模板。百度則是將大量詩歌作品數(shù)據(jù)進行訓練,通過主題規(guī)劃模型彌補詩句與主題關(guān)聯(lián)性偏移等問題。
那么何為主題規(guī)劃模型?根據(jù)百度官方介紹,主題規(guī)劃模型是在理解用戶 query 意圖的基礎(chǔ)上,對每一句詩的子主題進行規(guī)劃,從而實現(xiàn)了對整首詩主題的把控。例如,用戶 query 為“西湖”,模型規(guī)劃的子主題可能是“斷橋”、“煙雨”、“江南”等等。
百度詩歌生成系統(tǒng)把寫詩以模擬寫對聯(lián)的方式去進行文本輸出,根據(jù)前一句詩生成下一句詩。這種用聯(lián)詩方式生成的詩歌,容易發(fā)生詞藻堆砌的情況。但利用主題規(guī)劃模型,能在一定程度上避免這種情況。經(jīng)過測試后發(fā)現(xiàn),AI 生成的詩歌前后句的關(guān)聯(lián)性表現(xiàn)確實不錯。
上周,雷鋒網(wǎng)在現(xiàn)場跟進百度副總裁王海峰 AAAI 的演講時,他提到百度兩步生成中國詩歌的方法:
首先對每一行詩的主題進行規(guī)劃,然后進行具體詩句的生成。
舉個例子,如果用戶想要寫一首和春天有關(guān)的詩,那么詩歌規(guī)劃模型就會首先生成一個內(nèi)容概要,包括春天,桃花,燕和柳這四個主題,然后由 RNN 模型根據(jù)這四個主題生成四句詩,來完成整首詩歌的創(chuàng)作。
在下面展示的這三首詩中,中間這首是由 AI 詩人完成的,而其他兩首的作者都是中國古代詩人(白居易,劉因)。王海峰說到,多數(shù)人都無法分辨出這三首詩中到底哪一首出自 AI 詩人之手。歷史學者和《中國詩詞大會》嘉賓蒙曼教授也說到“這個人工智能詩人是詩壇小超人,能和人類詩人一樣在詩中表達感情色彩?!?/p>
隨著 AI 技術(shù)的門檻逐漸減低,可以預見未來越來越多的企業(yè)可以通過人工智能技術(shù)策劃相關(guān)的主題活動供用戶娛樂和互動。
雷峰網(wǎng)原創(chuàng)文章,未經(jīng)授權(quán)禁止轉(zhuǎn)載。詳情見轉(zhuǎn)載須知。