第322章 有私心的蘇小木
字數:4935 加入書籤
“呀,這是蘇小木學長!”
“在哪呢,在哪呢……”
“哇,小木同學開車來上學了?”
“這麽有錢的嗎?”
“你怕是不知道小木學弟才拿了多少獎金吧?ACMICPC的總冠軍獎金都是美元為單位的。”
“買個小大眾,問題不大的。”
“小大眾?怎麽那麽像邁騰?要一二十萬吧?”
“小木學長在校外供職於某公司,拿的是高工資,說不定還是公司給配的車呢!”
“哇,小木學弟關車門的姿勢好帥!”
“彎腰拿包的姿勢也好帥啊……”
“……”
蘇小木根本不知道就這短短的一兩分鍾的時間裏,就產生了這麽多的議論。
倒是有感覺到不少灼熱、炙熱的視線。
習以為常,並沒有太多的想法。
很快就根據課表去了教室。
如今不管是什麽樣的課程,哪怕是馬哲,蘇小木也會認真去聽。
“其實不是知識限製了我的想象力。”
“是知識麵與偏見。”
蘇小木喃喃自語。
因為對曆史心存偏見,所以完全不看重曆史。
卻不知道,哪怕所有的曆史都是由勝利者書寫的,那也是有參考意義的。
看看蘇荷,並沒有專修曆史,但也對很多曆史事件信手捏來。
就更不用說萬黛了。
時間就在學習中飛快度過,論專注,蘇小木還是有點發言權的。
上午的課程結束後,蘇小木並沒有回家或者去木數。
而是去了張可教授的課題實驗室。
…………
…………
蘇小木剛剛走進去,迎麵就碰到正在操作台上搗鼓著什麽的譚淩抬頭。
譚淩笑著道,“來了,小老弟。”
“誒,學長。”蘇小木應了聲。
“教授要1點30分才過來,他們也得一會才過來,你自己招呼,我還得忙一下。”譚淩說完就繼續忙自己的事情了。
課題實驗室並不是每時每刻都有人忙。
偶爾也會遇上沒人的時候,以及現在這樣,就譚淩孤零零的時候。
蘇小木也是熟門熟路的人,自己找了個操作台坐下。
很快,張可跟林唐等人一塊過來了。
“呦,小木同學今天來挺早。”張可嗬嗬笑道。
平時蘇小木來得都算比較晚的。
畢竟本科階段,尤其是……本科才二年級,學業還是挺繁忙的,不像其他碩士階段和博士階段的學長學姐。
大多數時間都是泡在課題研究上。
蘇小木撓了撓頭,靦腆一笑。
自從林唐知道蘇小木有女朋友後,明顯沒那麽開懷了。
都不怎麽撩蘇小木了。
隻是簡單打了個招呼。
一群人看著張可,大家都不知道今天張可突然召集大家過來做什麽。
“今天找大家過來,是因為所有的課題前準備已經完全完成,譚淩,你先跟大家簡單說一下。”張可也沒多囉嗦,直接開始了正事。
譚淩點頭,起身說道。
“經過近一個月的準備,前期所有的相關知識儲備與小課題實驗研究已經全部完成,包括課題實驗所需的雲計算平台、存儲、實驗參考數據……等均已準備完成……”
“……”
張可接過話頭,“今天,我們便啟動『大數據·算法、主導數據與行為模型』課題。”
張可的話語落下後,蘇小木等人都沒有太意外。
這個大課題拖的時間挺長了。
也是時候開始了。
不過大家都有意無意的看了眼蘇小木,心裏都明白張可有很大概率是為了等蘇小木完成ACM總決賽。
沒等大家開口,張可問道,“你們覺得,什麽是大數據?”
這個問題問出後,蘇小木、譚淩、林唐等人都陷入了沉思。
張可教授要聽的肯定不是網絡上的那些爛而化之的回答。
而是他們每一個人自己的總結。
從生活中、從學習中、從自身經曆的方方麵麵進行總結歸納並給出答案……
一般看來,大數據指無法在一定時間範圍內用常規軟件工具進行捕捉、管理和處理的數據集合。
是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的信息資產。
從技術上看,大數據與雲計算的關係就像一枚硬幣的正反麵一樣密不可分,必須采用分布式架構,必須依托雲計算的分布式處理、分布式數據庫和雲存儲、虛擬化技術。
同時大數據還需要特殊的技術,來有效處理大量的容忍經過時間內的數據。
這些技術包括大規模並行處理數據庫、數據挖掘、分布式文件係統、分布式數據庫、雲計算平台、互聯網和可擴展的存儲係統。
IBM也曾提出了大數據的特點:大量、高速、多樣、低價值密度、真實性。
但,大家都不會簡單的從這些概念上的東西來進行回答。
良久。
譚淩開口道,“我認為大數據就是數量龐大的任意數據,甚至這些數據本身並沒有什麽卵用,而且還沒什麽價值,扔之可惜。”
“當然,大數據其實始終貫穿著人類的曆史,從古至今的各種法例都能看到大數據的蹤跡。”
“比如連環案件分析?”林唐插嘴道。
也不知道林唐是不是最近看柯南看多了,張口就是連環案件。
其他幾人各有回答。
獨剩下蘇小木沉默不語。
“小木同學,你來說說?”張可點了名。
蘇小木簡單的答道,“說不好,我覺得大數據無非就是多維分析,最終針對的還是人。”
“每個人都有每個人對大數據的理解,我們的課題隻是從大數據出發,探索主導數據、行為模型的一個片段。”
張可道。
“大家可以通過課題,去找到每個人對大數據的新理解。”
“硬件層麵的準備基本完善,但軟件層麵的部署還得我們親自來,首先是分布式文件係統,我們討論一下,是否直接使用Hadoop實現的分布式文件係統:HDFS?”
張可的問題引發了課題實驗組每個成員的意見發表。
首先HDFS基本上是個通用的大數據分布式文件係統,最重要的一點是設計就是用來部署在低廉硬件上的。
包括Hadoop,完全就是為了大數據而開發的程序。
Hadoop框架最核心的設計就兩點,HDFS和MapReduce。
HDFS為海量數據提供了存儲方式,MapReduce為海量數據提供了計算。
蘇小木試圖爭取了一下,“教授,如果我們課題的時間足夠長的話,不如我們試試自己實現,不借用Hadoop,重新設計分布式文件係統、並行運算算法、並行處理數據庫這些。”
“這樣一來,專業針對的就是課題本身的算法、主導數據與行為模型。”
蘇小木的話是有道理的,當然也是有私心的……
======
2更。