第四十三章 牛刀小試

字數:5226   加入書籤

A+A-




    回到酒店,王一男打開隨身攜帶的筆記本電腦,啟動 fr id,開始整理自己的思路。

    人工智能是當前的熱點,而神經網絡又是熱點中的熱點,但是除了極少數領域,比如說車牌識別,或者極少數個例,比如說米歌的圍棋狗以外,在實踐中很少看到具體的應用案例。

    造成這種情況的原因很簡單,那就是神經網絡對硬件的依賴性,在普通的電腦或者基於ar芯片的手機上不是不能運行神經網絡,但是運行的效率絕對會讓你發狂。

    還有神經網絡那龐大的數據量,全部裝到手機裏麵幾乎是不可能的。

    所以,目前的神經網絡應用是極度依賴硬件的,這也就限製了它的應用範圍,反正你記住,在普通的手機上幾乎跑不起來一個實用的神經網絡就對了。

    但是有了王一男的新發現和新技術就完全不一樣了,對樣本的整理和訓練這一步沒有捷徑可言,老老實實的在專用硬件上花很長時間進行就好了,這也不是問題的焦點所在。

    但是一旦訓練完成,神經網絡穩定之後,王一男就可以利用一係列的數學工具,以及形式化技巧,根據神經網絡的類型,對龐大的神經網絡數據進行分塊的指令化。

    簡單的理解,可以認為將神經網絡這種多層迭代的運行方式,映射成普通馮諾依曼機器的運行方式。

    具體而言,比如說對於其中/的神經網絡分塊,映射為一種通用的馮諾依曼機器指令,比如說,java或者llv的字節碼吧。

    你可以認為王一男找到一種編譯方法,可以將神經網絡的數據,編譯成一種通用的字節碼,再利用現成的ji(即時編譯)技術,或者llv的編譯技術,得到可執行的p或者手機程序。

    最後,再將所有的分塊組合起來,就能得到任何訓練後的神經網絡,在p或者手機上的編譯版本。

    也就是說,製約人工智能發展的最大的障礙,硬件的限製現在完全不存在了,隻要在專用的硬件上用足夠的樣本訓練出符合要求的神經網絡,然後利用王一男的技術,就能夠將這個訓練好的神經網絡編譯到普通的p甚至手機上,從而得到一個可以完成同樣任務的手機app。

    我再舉一個具體的例子,大家就明白了,目前哥鯤鵬2.0通過訓練,學會了如何最高效率的飛行,但是它沒辦法直接教給人類怎麽飛行,而且又不能將哥鯤鵬帶上天,直接讓它指揮飛機怎麽飛。

    所以現在王一男和楊總師采用的方法是,自己編寫飛控軟件,然後讓哥鯤鵬來找到裏麵的缺陷,經過多次迭代來改進人類編寫的飛控軟件,從而獲得質量不錯的飛控軟件。

    有了王一男的新技術,現在可以直接將哥鯤鵬的神經網絡,編譯到飛控計算機的指令集,比如說alpha體係,編譯後的程序,實際上就是最好的飛控軟件了!

    不能理解、無法描述都沒關係,能執行就行!

    就算給新型號戰績加上矢量發動機,那也不過是多訓練兩天,重新編譯一下的功夫,立馬就能得到最牛的飛控軟件了。

    “這把玩大了”,王一男在電腦上敲完上麵的幾句話,搓著手,不知道該說啥。

    說真的,要是ia、fbi之流知道王一男現在做的事情,估計就算把他們在整個華國的特工都派過來,也要把他綁架走。

    當然,具體要完成這個構想,還需要大量的時間和工作,需要整理所有的神經網絡的類型,以及對應的數學工具,還要針對不同的數據生成抽象的指令序列。

    僅僅使用數學工具形式化的神經網絡數據,一定是冗長的,為了達到實用化的程度,需要對代碼進行精簡和優化,當然這方麵可以發揮哥德爾係統的特長。

    最好能夠將整個過程自動化和程序化,不過這個倒不是很著急,人的智慧配合機器來工作,一向是最快速最有效率的方案。

    王一男打消了找所第一個吃螃蟹的想法,雖然這樣一定會很爽的,但是所的最新隱身戰鬥機不要說華國了,整個藍星多少雙眼睛盯著,要是一不小心弄出一個驚天動地的飛控出來,王一男用腳趾頭都能想到動靜有多大,顯然這絕對違背了他低調的初衷。

    還是悶聲發大財的好,王一男把注意力集中在大衛計劃上,或者準確的來說,大衛計劃的一個點上,要知道,現在大衛計劃最大的問題,是缺乏一個殺手級別的應用,要那種遠遠超過別人的功能和效果。

    基本的聊天功能,再怎麽樣也很難玩出花來,隻有在現在並不是很成熟的一些領域上做文章了,比如說多人視頻聊天。

    目前視頻聊天技術的主流是h24,這也是大部分手機硬件都支持的視頻編解碼技術,對於一對一的視頻聊天來說,隻要對分辨率的要求不太高,效果還過得去。

    當然,要想效果好,還需要更新的技術比如說h25,或者米歌搞的vp0,啊不對,因為h25的專利問題,一堆業界大拿湊在一起開了一個新的項目,叫做開放媒體聯盟,他們搞了一個成人影片一號格式,不對,是音頻視頻一號格式(av),號稱比h25效率還要高。

    不管h24還是h25還是av,都是按照傳統的方法對視頻,或者說連續的圖像流進行壓縮的,也就是將視頻在頻譜上進行處理,減少人眼不太關注的部分,然後通過對時間域的分析,去掉相鄰圖像幀之間的重複部分等等。

    當然在這中間,利用分塊技術減少運算複雜度,或者自適應分塊技術,在編碼效率和編碼質量之間進行自動的權衡。

    王一男決定獨辟蹊徑,完全按照神經網絡的方式來處理問題,就像米歌的狗狗r版本一樣,他拋棄了所有預先的知識,甚至包括頻率的概念。

    神經網絡唯一的輸入來源是圖像的序列,評價算法的質量標準是解碼之後圖像序列跟原始圖像之間的偏差,這是有一個人眼視覺方差評估辦法的。

    采用這樣的方法對神經網絡進行訓練,王一男將算法時間也作為訓練的一個基本參數,也就是說,最小的大小,最快的時間,最小的人眼視覺方差,用所有能獲得的樣本進行訓練。..

    王一男回到帝都之後,簡單跟大衛計劃的團隊碰了碰,看了看他們的原型,然後要求團隊開始針對原型係統的問題,開發2.0版本,重點是可擴展的架構,以及服務的穩定性。

    而他自己又開始閉關了,學校顯然不是一個很好的閉關地點,周慧家就更不是了,王一男把自己關在容與公司的大本營,這樣也好,離哥德爾係統更近一些。

    閉關時候的王一男,就像完全變了個人,六親不認,目光呆滯,和平常那個平民模樣的年輕人完全對不上號,整個就是一個瘋狂科學家的形象,不過呢,效率確實高的驚人。

    周慧忍不住去容與公司看了他兩次,結果每次呆不了多一會就狼狽逃竄了,用她的話來說,太瘮人了,王一男大部分時間坐在鍵盤前麵瘋狂的打字,有時候像一個目光沒有焦距的幽靈一樣在辦公室裏麵飄來飄去,嘴裏還念念有詞,真是嚇死人不賠命。

    哥德爾係統開始利用無數的視頻樣本開始訓練,什麽yub,什麽愛藝,什麽又酷,反正王一男給哥德爾係統買了無數個vip賬號,瘋狂的讓它看視頻,至於會不會走火入魔,那就不是王一男考慮的範疇了。

    但是這些視頻樣本的數量貌似不太夠啊,關鍵是基本上所有的素材都經過了各種後期處理,或者美顏啊,或者剪接啊,反正對於神經網絡學習來說,不是原生態的,噪聲有點多。

    這個時候,王一男不禁要感謝王校長引發的直播風潮了,除了為風投找到一個瘋狂砸錢的紅海,為部分二次元屌絲男女提供致富的渠道以外,無數直播軟件,還給哥德爾係統提供了無數真實的視頻樣本。

    於是在容與公司總部,無數直播的視頻流被接了進來,然後轉換成哥德爾係統一個視頻壓縮的專用神經網絡權重。

    這可是一個拋棄了所有先驗知識的神經網絡,沒有傅裏葉分析,沒有小波分析,沒有運動預測,沒有分塊,更沒有離散餘弦變換。

    神經網絡的目標也很明確,壓縮原始的視頻數據,或者說時間域上的離散圖像幀,用盡可能小的尺寸、盡可能快的速度、還有盡可能小的人眼視覺方差,至於原理是什麽,誰關心呢?

    王一男的任務很簡單,也很繁重,他要找到一係列的數學工具,形式化技巧,並且把這些程序化,這樣哥德爾係統就能將訓練完成的神經網絡編譯成llv的字節碼,

    再經過多次迭代,優化之後,最終得到一個精簡版本的llv字節碼,

    這些字節碼,就可以定位到特定的pu架構中,比如說或者ar,得到可以實際工作的壓縮、解壓縮程序。

    不知道哥德爾係統看多了直播,會不會學會東北話,想來是不會的,不過王一男堅決沒讓哥德爾係統用那個發抖短視頻來訓練,科學家也是有潔癖的,“那麽l的東西,就汙染我好了,別汙染哥德爾係統了”,王一男想。

    時光荏苒,這期間,王一男還去上了兩堂課,陪周慧看了兩次電影,畢竟,瘋狂的科學家還是個正常人不是。

    哥德爾係統的視頻壓縮神經網絡也逐步的穩定下來了,編譯到llv指令的工作還沒完成,王一男迫不及待的要先看看直接用神經網絡進行視頻壓縮的效果,畢竟,要是還沒有h25強,那還不如洗洗睡了呢。

    他選中了一個藍光的4k分辨率片源,就是那種電視機廠商用來做廣告的幾分鍾的短視頻,使用h25標準壓縮後,大小大概是00。

    將h25視頻輸入到ffpg,解壓出jpg格式的每一幀圖像數據,再送往哥德爾係統,這中間當然會有畫質損失,不過王一男已經顧不得那麽多了,

    他屏住呼吸,兩眼緊盯著屏幕。(www.101novel.com)