第222章 注定無眠的夜晚
字數:7045 加入書籤
雖然尹芙·卡莉已經將林灰同其最近探討的成果以論文的形式整理了出來並且整理得還不錯。
但林灰還是決定在尹芙·卡莉撰寫的論文基礎上再完善一下。
畢竟這是來到這個時空裏林灰在純粹學術方麵的首秀。
對於這次首秀,林灰希望能夠做到盡善盡美。
盡管世界上幾乎不存在十全十美的東西。
但林灰的理念向來是要麽不做,要做就要做到極致。
在這種信念的驅使下,這注定是個無眠的夜晚了。
原本林灰也不需要這麽著急的。
但尹芙·卡莉發來的郵件中也順帶著提到了美國國內對生成式摘要算法跟進的情況。
形勢雖然不算是悲觀,但也談不上是很樂觀。
在林灰鼓搗出生成式摘要算法之後。
很多美國商業性質的科研機構都在迅速跟進林灰的研究。
除此之外,還有很多計算機方麵實力超強的美國大學(包括但不限於諸如麻省理工學院、斯坦福大學、卡內基梅隆大學等)也在跟進這一方向。
這些海外的科研機構會迅速跟進林灰的研究也不足為奇。
涉及到文本摘要這個自然語言處理的細分領域這方麵的研究雖然看起來不怎麽起眼。
普通人裏麵多數人中甚至沒啥人知道有人在從事著這方麵的工作。
但這絲毫不妨礙文本摘要對於人類文明進步的重要意義。
對此之前林灰已經進行過很多這方麵的論證了。
事實上這個時空這些海外的科研團隊應該一開始就很重視文本摘要這方麵的研究。
隻是現在的重視程度又提高了一個層級。
之所以重視程度提高一個層級跟林灰搞出的動靜有著不可分割的聯係。
在林灰的研究成果出現之後。
目前國內外常用的自動文本摘要技術根據摘要產生的不同方法可以分為兩種:
抽取式文本摘要和生成式文本摘要。
抽取式文本摘要的方法實現簡單,隻是從文檔中抽取已有的句子形成摘要。
生成式文本摘要則是要利用自然語言理解技術來執行文本的語法和語義分析和融合信息並在此基礎上生成新的摘要句子。
由於林灰剛搞出生成式摘要算法沒多久。
所以現在生成式摘要算法除了在南風app上應用了之外其應用範圍還不算太廣泛。
反倒是抽取式方法由於一些曆史方麵的沿革而在應用方麵較為廣泛。
但這並不能據此否定生成式文本摘要的價值。
學術層次從來都不是多數壓倒少數的,真理往往掌握在少數人手中。
抽取式文本摘要歸根結底隻能看作一個組合優化問題。
這在生成式文本摘要麵前終究是落了下乘。
盡管處理同一個問題(文本摘要)的兩種方法強行分為上下乘似乎有些不妥。
可人類在文本摘要的目的是什麽呢?
甚至於人類在自然語言處理這方麵的研究的目的是什麽呢?
終歸不過是為了更好的理解自然語言進而能夠更加高效地處理自然語言。
以這個角度來衡量的話,生成式摘要算法在理解自然語言方麵的能力無疑要比抽取式摘要算法高到不知道哪去了。
因此稱生成式文本摘要算法為上乘而抽取式文本摘要算法為下乘也不偏頗。
想來這些海外的研究團隊應該也是看到了林灰搞出來的生成式摘要算法在讓機器對自然語言的理解能力更上一層樓之後。
才會對生成摘要這方麵研究的重視程度進一步提升。
不得不說,方向對了。
事實上前世由於人工智能領域崛起基於人工智能的生成式文本摘要得到質的飛躍之後生成式文本摘要更是一舉成為生成摘要的主要研究方向。
不過僅僅是一些科研機構在文本摘要算法方麵加大投入還不足以讓林灰這麽重視。
林灰已經在生成式摘要算法這方麵構築了相當完備的技術壁壘。
想要彎道超車是不可能的,這些科研團隊所能采取的方式無非是繼續按照林灰先前公布的技術路線造輪子。
林灰比較警惕地是:
因為這些科研機構將關注的重心放在文本摘要這個細分領域之後。
海外很多原本一直處在冷宮的自然語言處理方麵的部分細分領域的研究最近也被重拾起來。
甚至於連帶著機器學習其餘領域的一些原本冷門的研究方向也有回暖的跡象。
這對林灰可不是一個好消息。
這很可能打斷林灰此前的一些部署。
縱然林灰在除卻文本摘要之外的其餘領域也有著技術方麵的優勢。
七年甚至七年以上的信息優勢想要一朝逾越是不可能的。
但現在這種情況也意味著林灰想要藉此一勞永逸也是不現實的。
對手雖然進步的很慢,但也是一直在進步的。
林灰如果固步自封的話,遲早會被超越的。
龜兔賽跑的故事家喻戶曉,這裏麵的道理自然不需多言。
弱小和無知從來不是生存的障礙,傲慢才是。
盲目的自負和藐視對手是要付出慘痛的代價的。
更何況對手還是科研實力地表第一梯隊的美國。
林灰是不能絲毫大意。
不僅不能大意,而且今後林灰必須加大在自然語言處理和機器學習這方麵落子的速度了。
隻有比對手進步的更快,才能不斷碾壓對手。
心念及此,林灰很快就進入了熬夜奮戰的狀態。
盡管是熬夜奮戰,林灰也不覺得有什麽疲憊。
非但不疲憊,而且神清氣明,思維始終處於很活躍的狀態。
現在林灰似乎愈發可以肯定其重生之後穿過時空隧道之時身體獲得一定程度的強化了。
不過事情也不絕對,林灰依舊不能完全排除這事是否是因為金錢刺激的影響。
雖然像這種論文跟之前的代碼有些不同,這種論文並沒有什麽直接經濟效益。
但並不能說這些論文沒有經濟效益。
這類論文的間接經濟效益還是有的,不但有,而且經濟效益還十分顯著。
在這種情況下,林灰也不能判斷是身體被強化了還是說依舊是金錢刺激。
或許什麽時候可以更嚴格控製一下相關變量進行一下測試。
但林灰覺得很難,這個世界完全不摻雜任何金錢利益或者其餘形式利益的事情少之又少。
反正縱然是此時思維比較活躍,林灰也沒想到比較好的驗證方法。
多思無益,林灰也不再糾結。
趁著思維活躍,林灰全身心投入到工作中。
在這種全身心地投入下,林灰工作效率很高。
原本林灰是做好奮戰通宵的準備的。
結果才淩晨三點不到林灰就將論文改得差不多了。
確切地說涉及到論文的核心表述方麵已經沒有任何問題了。
能這麽快改得差不多除了林灰高度活躍的思維之外。
也得益於先前尹芙·卡莉做的前期工作很棒。
之所以還沒徹底完成還是因為語言方麵的一些原因。
為了追求學術前沿就特麽得寫英文論文?
以後林灰牛比了擁有某一研究領域的絕對話語權之後絕對要求所有歪果仁都寫成中文論文往外發。
理想很豐滿,不過現實很骨感。
隻能說是任重道遠。
這之後,林灰又將他微調了一點點的論文給尹芙·卡莉回了過去。
要尹芙·卡莉有空幫忙潤色一下。
此後,林灰也沒怎麽有睡意。
林灰想到前不久他想要鼓搗的關於手機病毒方麵的專利。
雖然短時間內林灰沒申請該專利的打算。
但先將相應的材料整理出來總是好的,免得到時候還要額外花費時間。
重生以後,時間是林灰最寶貴的財富。
也是林灰潛在的最大威脅。
時間是一條不會逆行的河流。
林灰的經曆中逆行過一次的河流已然屬於神跡了。
這樣的經曆林灰覺得是沒有機會再遇到了。
重生之後,林灰的時間跟這個時空的任何人一樣。
每一秒過去了也不會再回來了。
這種情況下,林灰格外珍惜每分每秒。
盡管這種狀態或許很忙碌,但林灰相信隨著他的忙碌會有很多人隨之而忙碌。
畢竟再有七年甚至是七年以上信息優勢的情況下。
林灰的很多努力都是踩在巨人的肩膀上的。
站在巨人的肩膀上,林灰可以夠得比別人更高,看得比別人更遠。
依舊是拿自動文本摘要來說吧。
這個時空的科研人員在處理自動文本摘要問題的時候可能會僅僅局限在文本摘要這一塊。
但林灰想得卻要更多。
文本摘要的不斷迭代人們會對摘要的準確度提出更高的要求。
而對文本摘要準確度的更高要求連帶著會對神經網絡學習產生更高水平的要求。
而神經網絡方麵即將到來的突破將催生人工智能的興盛。
以神經網絡為核心的人工智能的興盛可能又會催生生物方麵的進步。
神經網絡看似是計算機方麵的研究,其實不純粹。
神經網絡的發展得益於生物學的突破。
而神經網絡方麵的研究又會反哺於生物學。
這些雖然可能還有些遙遠。
但這就是未來。
誰洞察了未來的先機,誰就終將勝利。
總之,站在巨人肩膀上的林灰相信其有能力輕而易舉得影響世界。
之前林灰搞得生成式摘要算法,無形之中調動世界上眾多科研機構的忙碌不正說明這一情況麽?
一個人的忙碌讓一堆人不得不更忙碌。
這種現象用前世的話叫什麽呢?
對,沒錯,就是“卷”。
重生者不當卷王,難道帶頭躺平麽?
林灰遲早卷死這個時空所有的潛在敵對勢力。