第262章 新世界之始

字數:2406   加入書籤

A+A-




    怎麽說莫浩波也是發了兩篇論文到arXiv的專家了,即便沒有紙質的。再加上也在github這個代碼托管平台上開源了的代碼和python安裝包,人工智能磚家這個稱號,莫浩波當之無愧。

    再說了,他又不是什麽混進計算機科學的統計學教授,前世的他,可是正兒八經的科班出身,自信和自豪那是有的。他相信,很快,他就要成名了。

    那誰說的,走別人的路,讓別人無路可走;亦或者是領先半步是天才,領先一步是瘋子。

    所以說,莫浩波還是得緊抓時代熱點吧。2013年的熱點是啥?毫無疑問,那是做圖像處理的CNN啊!

    不過,想要緊追這個熱點,也不是那麽容易的。首先,是人工智能的框架不太成熟,用得比較多的,還是theano,也不知道有沒有python版本的。

    不過不管有沒有,莫浩波都沒有興趣去學習這樣古老工具,想了又想,他咬咬牙,怒發tensorflow,最初的版本也沒有了,不過,比較成熟的0.12版,卻還是有代碼的。

    tensorflow框架依賴的工具包主要有Bazel和Protocol Buffer,前者管理各種基礎工具包,就像Java中的maven一樣,而後者則是為了處理數據的,都是15年開源的項目了,現在應該是沒有開發的。

    所以,主導並開源這個工具,莫浩波毫無心理障礙。有阻礙那也是穀歌剽竊,莫浩波厚顏無恥地想著。

    如此,tensorflow上麵集成的CNN算法倒是無礙,就是2013年,CNN也算是比較成熟了的,即便是有創新,那也是超級大的網絡結構了,暫時不具備莫浩波等小團隊使用,不能迅速推廣開。

    倒是RNN,後來,尤其是2014年,2015年,出現了很多牛叉的架構,極大地推動了自然語言處理技術的發展,雖然這技術對NLP的效果也不咋樣。

    粗略一看,鼎鼎大名的就有Gru單元,雙向LSTM模型,Seq2Seq模型,生成對抗網絡(GAN模型),Attention機製等等等,一大批,影響深遠的方法技術。

    而這些,也都集成在了tensorflow裏邊。而這些,莫浩波似乎沒有察覺。他隻是覺得theano框架太複雜,不好用,想上他使用習慣的tensorflow罷了。

    說到CNN與自然語言處理的關係,那自然不能不提及Text-CNN了,這是2014年的分類模型了,使用了類似N-Gram的特性,分詞效果對比以前的深度學習算法有了質的提高,即便不及傳統機器學習SVM,但後來引用都有2000+了,這可是不折不扣的厲害paper,怎麽能放過呢?

    說幹就幹,重新選擇幾個數據集測試,對比SVM、LR、NB、KNN、BP等算法,效果馬上看得見的,更重要的是,現在的熱點可是CNN!

    對於這點,莫浩波絲毫不去擔心。他的重點放在了twnsorflow的開源代碼上麵,那些新穎的模型和架構是不合適放出來了的,他得刪掉,這是個麻煩事。

    第二天早上10點22,這個激動人心的時刻,莫浩波上傳了影響人類一百年的深度學習框架——tensorflow!與之一同上傳的,還有這篇TextCNN的論文。

    這時候,即便是小薑老師的郵件,莫浩波也絲毫不為她所動。他在等待,等待第一個幸運的讀者呢!

    不知過去了多久,github上邊的fork數顯示為1,打星數也設為1,莫浩波笑了,開心地笑了。

    還沒笑夠,冷不防芯片來襲:“人工智能基石發布,科技值100,科技滿值!”

    “科技值+1,芯片科技值滿,無法增加!”

    “啟動後備計劃,充能中……”

    “芯片充能滿,啟動能量釋放程序!”

    “能量釋放,釋放中,突破時空障礙,搜索穿越世界!”

    “動漫世界搜索中……”

    “已找到目標,目標躍遷!”

    “躍遷中……”

    酥地一下,莫浩波消失在原地,不知道傳送到了哪個動漫世界中。(m.101novel.com)