第322章 有私心的蘇小木

字數:4935   加入書籤

A+A-


    “呀,這是蘇小木學長!”
    “在哪呢,在哪呢……”
    “哇,小木同學開車來上學了?”
    “這麽有錢的嗎?”
    “你怕是不知道小木學弟才拿了多少獎金吧?ACMICPC的總冠軍獎金都是美元為單位的。”
    “買個小大眾,問題不大的。”
    “小大眾?怎麽那麽像邁騰?要一二十萬吧?”
    “小木學長在校外供職於某公司,拿的是高工資,說不定還是公司給配的車呢!”
    “哇,小木學弟關車門的姿勢好帥!”
    “彎腰拿包的姿勢也好帥啊……”
    “……”
    蘇小木根本不知道就這短短的一兩分鍾的時間裏,就產生了這麽多的議論。
    倒是有感覺到不少灼熱、炙熱的視線。
    習以為常,並沒有太多的想法。
    很快就根據課表去了教室。
    如今不管是什麽樣的課程,哪怕是馬哲,蘇小木也會認真去聽。
    “其實不是知識限製了我的想象力。”
    “是知識麵與偏見。”
    蘇小木喃喃自語。
    因為對曆史心存偏見,所以完全不看重曆史。
    卻不知道,哪怕所有的曆史都是由勝利者書寫的,那也是有參考意義的。
    看看蘇荷,並沒有專修曆史,但也對很多曆史事件信手捏來。
    就更不用說萬黛了。
    時間就在學習中飛快度過,論專注,蘇小木還是有點發言權的。
    上午的課程結束後,蘇小木並沒有回家或者去木數。
    而是去了張可教授的課題實驗室。
    …………
    …………
    蘇小木剛剛走進去,迎麵就碰到正在操作台上搗鼓著什麽的譚淩抬頭。
    譚淩笑著道,“來了,小老弟。”
    “誒,學長。”蘇小木應了聲。
    “教授要1點30分才過來,他們也得一會才過來,你自己招呼,我還得忙一下。”譚淩說完就繼續忙自己的事情了。
    課題實驗室並不是每時每刻都有人忙。
    偶爾也會遇上沒人的時候,以及現在這樣,就譚淩孤零零的時候。
    蘇小木也是熟門熟路的人,自己找了個操作台坐下。
    很快,張可跟林唐等人一塊過來了。
    “呦,小木同學今天來挺早。”張可嗬嗬笑道。
    平時蘇小木來得都算比較晚的。
    畢竟本科階段,尤其是……本科才二年級,學業還是挺繁忙的,不像其他碩士階段和博士階段的學長學姐。
    大多數時間都是泡在課題研究上。
    蘇小木撓了撓頭,靦腆一笑。
    自從林唐知道蘇小木有女朋友後,明顯沒那麽開懷了。
    都不怎麽撩蘇小木了。
    隻是簡單打了個招呼。
    一群人看著張可,大家都不知道今天張可突然召集大家過來做什麽。
    “今天找大家過來,是因為所有的課題前準備已經完全完成,譚淩,你先跟大家簡單說一下。”張可也沒多囉嗦,直接開始了正事。
    譚淩點頭,起身說道。
    “經過近一個月的準備,前期所有的相關知識儲備與小課題實驗研究已經全部完成,包括課題實驗所需的雲計算平台、存儲、實驗參考數據……等均已準備完成……”
    “……”
    張可接過話頭,“今天,我們便啟動『大數據·算法、主導數據與行為模型』課題。”
    張可的話語落下後,蘇小木等人都沒有太意外。
    這個大課題拖的時間挺長了。
    也是時候開始了。
    不過大家都有意無意的看了眼蘇小木,心裏都明白張可有很大概率是為了等蘇小木完成ACM總決賽。
    沒等大家開口,張可問道,“你們覺得,什麽是大數據?”
    這個問題問出後,蘇小木、譚淩、林唐等人都陷入了沉思。
    張可教授要聽的肯定不是網絡上的那些爛而化之的回答。
    而是他們每一個人自己的總結。
    從生活中、從學習中、從自身經曆的方方麵麵進行總結歸納並給出答案……
    一般看來,大數據指無法在一定時間範圍內用常規軟件工具進行捕捉、管理和處理的數據集合。
    是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
    從技術上看,大數據與雲計算的關係就像一枚硬幣的正反麵一樣密不可分,必須采用分布式架構,必須依托雲計算的分布式處理、分布式數據庫和雲存儲、虛擬化技術。
    同時大數據還需要特殊的技術,來有效處理大量的容忍經過時間內的數據。
    這些技術包括大規模並行處理數據庫、數據挖掘、分布式文件係統、分布式數據庫、雲計算平台、互聯網和可擴展的存儲係統。
    IBM也曾提出了大數據的特點:大量、高速、多樣、低價值密度、真實性。
    但,大家都不會簡單的從這些概念上的東西來進行回答。
    良久。
    譚淩開口道,“我認為大數據就是數量龐大的任意數據,甚至這些數據本身並沒有什麽卵用,而且還沒什麽價值,扔之可惜。”
    “當然,大數據其實始終貫穿著人類的曆史,從古至今的各種法例都能看到大數據的蹤跡。”
    “比如連環案件分析?”林唐插嘴道。
    也不知道林唐是不是最近看柯南看多了,張口就是連環案件。
    其他幾人各有回答。
    獨剩下蘇小木沉默不語。
    “小木同學,你來說說?”張可點了名。
    蘇小木簡單的答道,“說不好,我覺得大數據無非就是多維分析,最終針對的還是人。”
    “每個人都有每個人對大數據的理解,我們的課題隻是從大數據出發,探索主導數據、行為模型的一個片段。”
    張可道。
    “大家可以通過課題,去找到每個人對大數據的新理解。”
    “硬件層麵的準備基本完善,但軟件層麵的部署還得我們親自來,首先是分布式文件係統,我們討論一下,是否直接使用Hadoop實現的分布式文件係統:HDFS?”
    張可的問題引發了課題實驗組每個成員的意見發表。
    首先HDFS基本上是個通用的大數據分布式文件係統,最重要的一點是設計就是用來部署在低廉硬件上的。
    包括Hadoop,完全就是為了大數據而開發的程序。
    Hadoop框架最核心的設計就兩點,HDFS和MapReduce。
    HDFS為海量數據提供了存儲方式,MapReduce為海量數據提供了計算。
    蘇小木試圖爭取了一下,“教授,如果我們課題的時間足夠長的話,不如我們試試自己實現,不借用Hadoop,重新設計分布式文件係統、並行運算算法、並行處理數據庫這些。”
    “這樣一來,專業針對的就是課題本身的算法、主導數據與行為模型。”
    蘇小木的話是有道理的,當然也是有私心的……
    ======
    2更。