“微軟以1.1億美元的價格購買了大數據公司Farecast,而兩年後穀歌則以7億美元的價格購買了給Farecast提供數據的ITA Software公司。如今,我們正處在大數據時代的早期,思維和技術是最有價值的,但是最終大部分的價值還是必須從數據本身中挖掘。”2011年,西雅圖一家叫Decide.的科技公司推出了一個雄心勃勃的門戶網站,它想為無數顧客預測商品的價格。不過它最初計劃的業務範圍隻限於電子產品,包括手機、平板電視、數碼相機等。公司的計算機會收集電子商務網站上所有電子產品的價格數據和產品信息。網絡產品的價格受一係列因素的影響全天都在不斷更新,所以公司收集的價格數據必須是即時的。這不僅是一個“大數據”問題,還是一個“大文本”問題,因為係統必須進行數據分析,才會知道一個產品是不是下架了或者是不是有新產品要發布了,這些都是用戶想知道的信息而且都會影響產品價格。經過一年的時間,Decide.分析了近400萬產品的超過250億條價格信息。它發現了一些過去人們無法意識到的怪異現象,比如在新產品發布的時候,舊一代的產品可能會經曆一個短暫的價格上浮。大部分人都習慣性地認為舊產品更便宜,所以會選擇買舊產品,其實這取決於你什麼時候購買,不然有可能你付出的金錢比購買新產品還要多。因為電子商務網站都開始使用自動定價係統,所以Decide.能夠發現不正常、不合理的價格高峰,然後告知用戶何時才是購買電子產品的最佳時機。表麵上,Decide.就像眾多前途光明的科技公司一樣,在創新地使用數據、賺取利潤。但是事實上,讓Decide.異軍突起的不是數據,不是技術,而是思維觀念。Decide.使用的數據都來自電子商務網站和互聯網,這是公開的數據,每個人都可以利用。技術上,公司也並沒有無可替代的技術人才。所以,雖然數據和技術也是不可或缺的,但是真正使得該公司取得成功的是他們擁有大數據的思維觀念。它先人一步地挖掘出了數據的潛在價值。Decide.和Farecast之間似乎有著相通性,如果你知道它們都是華盛頓大學奧倫·埃齊奧尼先生的傑作,你就知道原因了。上一章中,我們討論了怎樣通過創新用途,挖掘出數據新的價值,主要是指我們所說的潛在價值。如今,我們的重點轉移到了使用數據的公司和它們如何融入大數據價值鏈中。我們將討論這對公司、個人的事業和生活意味著什麼。根據所提供價值的不同來源,分彆出現了三種大數據公司。這三種來源是指:數據本身、技能與思維。這些公司擁有大量數據或者至少可以收集到大量數據,卻不一定有從數據中提取價值或者用數據催生創新思想的技能。最好的例子就是Twitter,它擁有海量數據這一點是毫無疑問的,但是它的數據都通過兩個獨立的公司授權給彆人使用。它們通常是谘詢公司、技術供應商或者分析公司。它們掌握了專業技能但並不一定擁有數據或提出數據創新性用途的才能。比方說,沃爾瑪和Pop-Tarts這兩個零售商就是借助天睿公司(Teradata)的分析來獲得營銷點子,天睿就是一家大數據分析公司。皮特·華登(Pete Wardepac的聯合創始人,就是通過想法獲得價值的一個例子。Jetpac通過用戶分享到網上的旅行照片來為人們推薦下次旅行的目的地。對於某些公司來說,數據和技能並不是成功的關鍵。讓這些公司脫穎而出的是其創始人和員工的創新思維,他們有怎樣挖掘數據的新價值的獨特想法。同時,穀歌的首席經濟學家哈爾·範裡安(Hal Varian)認為統計學家是世界上最棒的職業,他的這種說法非常著名。“如果你想成功,你不應該成為一個普通的、可被隨意替代的人,你應該成為稀缺的、不可替代的那類人,”他還說,“數據非常之多而且具有戰略重要性,但是真正缺少的是從數據中提取價值的能力。這也就是為什麼統計學家、數據庫管理者和掌握機器理論的人是真正了不起的人。”但是,過分強調技術和技能而忽視數據本身的重要性也是不可取的。隨著計算機行業的發展,人力技術的落後會被慢慢地克服,而範裡安所讚賞的技能將會變成十分普通的事情。認為當今世界數據非常之多,所以收集數據很簡單而且數據價值並不高的想法是絕對錯誤的——要知道原因,就必須考慮到大數據價值鏈的各個部分,以及它們會如何發展變化。大數據最值錢的部分就是它自身,所以最先考慮數據擁有者才是明智的。他們可能不是第一手收集數據的人,但是他們能接觸到數據、有權使用數據或者將數據授權給渴望挖掘數據價值的人。有的公司精明地把自己放在了這個信息鏈的核心,這樣它們就能擴大規模、挖掘數據的價值。信用卡行業的情況就符合這一點。多年來,防範信用詐騙的高成本使得許多中小銀行都不願意發行自己的信用卡;而是由大型金融機構發行,因為隻有它們才能大規模地投入人力物力發展防範技術。美國第一資本銀行和美國銀行這樣的大型金融機構就承擔了這個工作。但是現在小銀行後悔了,因為沒有自己發行的信用卡,它們就無從得知客戶的消費模式,從而不能為客戶提供定製化服務。處於這個數據鏈的中心,MasterCard占據了收集數據和挖掘數據價值的黃金位置。我們可以想象,未來的信用卡公司不會再對交易收取傭金,而是免費提供支付服務。作為回報,它們會獲得更多的數據,而對這些數據進行複雜的分析之後,它們又可以賣掉分析結果以取得利潤。第二種類型就是擁有技術和專業技能的公司。MasterCard選擇了自己分析,有的公司選擇在兩個類型之間遊移,但是還有一部分公司會選擇發展專業技能。比方說,埃森哲谘詢公司就與各行各業的公司合作應用高級無線感應技術來收集數據,然後對這些數據進行分析。在醫學數據領域,我們可以看到一個關於技術公司如何能提供有效服務的很好的例子。位於華盛頓州的華盛頓中心醫院與微軟研究中心合作分析了多年來的匿名醫療記錄,涉及患者人口統計資料、檢查、診斷、治療資料,等等。這項研究是為了減少感染率和再入院率,因為這兩項所耗費的費用是醫療衛生領域最大的一部分,所以任何可以減少哪怕是很小比例的方法都意味著節省巨大的開支。這項研究發現了很多驚人的相關關係:在一係列情況下,一個出院了的病人會在一個月之內再次入院。有一些情況是眾所周知但還沒有找到好的解決辦法的,比方說,一個患充血性心力衰竭的病人就很有可能再次入院,因為這是非常難醫治的病。但是研究也發現了一個出人意料的重要因素,那就是病人的心理狀況。如果對病人最初的診斷中有類似“壓抑”這種暗示心理疾病的詞的話,病人再度入院的可能性大很多。雖然這種相關關係對於建立特定的因果關係並無幫助,但是這表明,如果病人出院之後的醫學乾預是以解決病人的心理問題為重心,可能會更有利於他們的身體健康。這樣就可以提供更好的健康服務,降低再入院率和醫療成本。這個相關關係是機器從一大堆數據中篩選出來的,也是人類可能永遠都發現不了的。微軟不控製數據,這些數據隻屬於醫院;微軟沒有出彩的想法,那並不是這裡需要的東西,相反,微軟隻是提供了分析工具,也就是Amalga係統來幫助發現有價值的信息。大數據擁有者依靠技術專家來挖掘數據的價值。但是,雖然受到了高度的讚揚,而且同時擁有“數據武士”這樣時髦的名字,但技術專家並沒有想象中那麼耀眼。他們在大數據中淘金,發現了金銀珠寶,可是最後卻要把這些財富拱手讓給大數據擁有者。第三種類型是有著大數據思維的公司和個人。他們的優勢在於,他們能先人一步發現機遇,儘管本身並不擁有數據也不具備專業技能。事實上,很可能正因為他們是外行人,不具備這些特點,他們的思維才能不受限製。因為有著大數據思維,克羅斯和他的FlightCaster是第一個行動起來的,但也沒比彆人快多少。2009年8月,FlightCaster公開發布了。同一個月,FlyOnTime.us的計算機專家們也開始搜刮公開的數據建立他們的網站。最終,FlightCaster的優勢慢慢地減弱了。2011年1月,克羅斯和他的同伴把網站賣給了 Jump,這是一個使用大數據技術進行企業折扣管理的公司。之後,克羅斯把他的目光轉向了另外一個夕陽行業——新聞行業。他發現,這裡是一個創新型的外行人可以大有作為的寶地。他的科技創新公司Prismatic收集網上資源並排序,這種排序建立在文本分析、用戶喜好、社交網絡普及和大數據分析的基礎之上。重要的是,這個係統並不介意這是一個青少年的博客、一個企業網站還是《華盛頓郵報》上的一篇報道,隻要它的內容相關並且很受歡迎就能排在很靠前的位置。而關於是否受歡迎,是通過它的點擊率和分享次數來體現的。作為一項服務,Prismatic關注的是年青一代與媒體進行交流的新方法,信息的來源並不重要。同時,這也給那些自視過高的主流媒體提了一個醒:公眾的力量要遠遠超過它們,而西裝革履的記者們也需要與一群不修邊幅的博主進行競爭。也許最令人無法想象的是,Prismatic居然是從新聞領域內部誕生出來的,雖然它確實收集了大量的數據。美國國家記者俱樂部(National Press Club)的常客從來沒有想過要再利用網上的媒體資源,阿蒙克、紐約和印度班加羅爾的分析專家們也沒有想過要用這種方法來使用數據。克羅斯頂著一頭蓬鬆的頭發,說話吞吞吐吐,可就是這樣一個不起眼的外行人,想到了也做到了,他使用這些數據來告訴世界什麼是比《紐約時報》更有用的信息來源。大數據思維這個概念以及一個擁有創新思維的人的地位,與20世紀90年代電子商務初期出現的情況是不一樣的。電子商務先驅者們的思想沒有被傳統行業的固有思維和製度缺陷所限製,因此,在對衝基金工作的金融工程師傑夫·貝索斯創建了網上書店亞馬遜而不是巴諾書店(全美最大的實體書店。——譯者注);軟件開發工程師皮埃爾·奧米迪亞(Pierre Omidyar)開發了一個拍賣網站而不是蘇富比(Sotheby's)(全球最有影響力的線下拍賣行。——譯者注)。如今,擁有大數據思維的領導者通常自己並不擁有數據資源。但就是因為這樣,他們不會受既得利益和金錢欲望這樣的因素影響而阻礙自己的想法實踐。就像我們看到的,也有公司集合了大數據的多數特點。埃齊奧尼和克羅斯不僅比彆人早一步有了這些決勝的思想,他們也有技術優勢。Teradata和埃森哲的員工不僅規規矩矩地打卡上班,還時不時會有些機靈的點子。這些原型都有助於我們認識不同公司所承擔的角色。我們在上一章節中提到的手機公司掌握了海量的數據卻不知道該如何使用,然而,它們可以把這些數據授權給有能力挖掘出數據價值的人。同樣地,Twitter一早就決定把它所掌握的海量數據授權給了兩家公司。如今的大數據先驅者們通常都有著交叉學科背景,他們會將這些知識與自己所掌握的數據技術相結合,應用於廣泛的領域之中。新一代的天使投資人和企業家正在誕生,他們主要是來自穀歌已經離職的員工和所謂的“Paypal黑手黨”(指的是Paypal公司的前領導人皮特·泰爾(Peter Thiel)、雷德·霍夫曼(Reid Hoffman)以及馬克斯·萊文奇恩(Max Lev)。——作者注)。他們與少量的計算機科學家一起充當了當今許多數據科技公司的最大靠山。這種將企業和個人置於大數據價值鏈中的創新性想法促使我們重新審視公司的存在價值。比方說,Salesforce不再是一個單純為企業提供應用軟件的平台,它還能挖掘這些軟件所收集到的數據並且釋放出它們的巨大價值。一旦得以有效利用,大數據就可以變革公司的贏利模式和傳統交流方式。我們舉一個典型的例子,通過得到競爭對手所沒有的行業信息,歐洲一家汽車製造商重新定位了與它的一個零件供應商的關係。(因為這是來自一個分析師在處理大量數據的基礎上得到的結果,而這個結果並沒有公開,所以我們在此不方便披露該公司的名字。——作者注)如今的汽車裝滿了芯片、傳感器和各種軟件,一經啟動,它們就會及時把汽車狀況信息發送到製造商的電腦上。一個典型的中檔車大概有60個微型處理器,車上電子儀器的價值占了車輛總價值的三分之一。車載電子儀器之多使汽車成了“漂浮的觀景台”,這本是莫裡用來形容船舶的。而這些設備監控到的汽車零部件的工作狀況,能夠在整合之後用來提高汽車的質量,因此,能夠掌握這些數據的公司擁有非常大的競爭優勢。汽車製造商通過與行業外的數據分析公司合作發現,德國供貨商供應的油箱的蒸汽泄漏檢測傳感器存在一些問題,它會對好的油箱產生錯誤報警達16次。汽車製造商可以把這些信息反饋給供貨商要求修理。在商業環境更加和諧的情況下,也許會發生上麵說到的情況,但是既然汽車製造商已經在這個項目上花費了一大筆錢,它就會利用這個數據挽回一點點損失。所以,汽車製造商開始考慮到底應該怎麼做:賣掉這個數據?它值多少錢呢?如果供貨商推卸責任呢?如果是我自己在操作過程中出現了失誤呢?而且它知道,一旦公布了信息,和自己用同樣零件的競爭對手也會改進他們的車。更明智的選擇應該是,這些數據隻能讓自己受益,自己的汽車能夠有所改進。最終,汽車製造商想到了一個好主意。它通過改進軟件而改進了這個零件,而且為這次改進申請了專利。然後,它把這項專利賣給了供貨商,價格是很長一段時間內進行數據分析的成本的總額。誰在這個大數據價值鏈中獲益最大呢?現在看來,應該是那些擁有大數據思維或者說創新性思維的人。就像我們所見的一樣,自從信息時代以來,這些第一個吃螃蟹的人都發了大財。但是,這種先決優勢並不能維持很長的時間。隨著大數據時代的推進,彆人也會吸收這種思維,然後那些先驅者的優勢就會逐漸減弱。那麼,核心價值會不會在技術上?畢竟,一個金礦的價值也隻有在它被挖掘出來之後才有意義。但是,計算機的曆史卻否定了這一想法。如今,在數據庫管理、數據科學、數據分析、機器學習算法等類似行業的技能確實很走俏。但是,隨著大數據成為人們生活的一部分,而大數據工具變得更容易和更方便使用,越來越多的人會掌握這些技能,所以這些技能的價值就會相對減少,就像20世紀60~80年代之間計算機編程技術變得越來越普遍一樣。現在,國外的外包公司使得基礎的計算機編程技術越來越廉價,如今它甚至成為了世界貧困人口的致富驅動力,而不再代表著高端技術。當然,這一切並不是要說大數據技能不重要,隻是這不是大數據價值的最主要來源。畢竟,技術是外在的力量。然而,如果數據擁有者做長遠打算的話,有一個小問題十分值得關注:那就是在有些情況下會出現“數據中間人”,它們會從各種地方搜集數據進行整合,然後再提取有用的信息進行利用。數據擁有者可以讓中間人充當這樣的角色,因為有些數據的價值隻能通過中間人來挖掘。當然,很多行業已經有過信息共享了,比較著名的有保險商實驗室,還有一些已經聯網了的行業,比如銀行業、能源和通信行業。在這些行業裡,信息交流是避免問題最重要的一環,監管部門也要求它們信息互通。市場研究公司把幾十年來的數據都彙集在一起,就像一些專門負責審計報刊發行量的公司一樣。這是一些行業聯盟組織的主要職責。如今不同的是,數據開始進入市場了。數據不再是單純意義上的數據,它被挖掘出了新的價值。比方說,Inrix收集的交通狀況數據信息會比表麵看上去有用得多,它被用來評測一個地方的經濟情況,因為它也可以提供關於失業率、零售額、業餘活動的信息。2011年,美國經濟複蘇開始放緩,雖然政客們強烈否定,但是這個信息還是被交通狀況分析給披露了出來。Inrix的分析發現,上下班高峰時期的交通狀況變好了,這也就說明失業率增加了,經濟狀況變差了。同時,Inrix把它收集到的數據賣給了一個投資基金,這個投資基金把交通情況視作一個大型零售商場銷量的代表,一旦附近車輛很多,就說明商場的銷量會增加。在商場的季度財政報表公布之前,這項基金還利用這些數據分析結果換得了商場的一部分股份。大數據價值鏈上還出現了很多這樣的中間人。比較早期的一個就是Hitwise,現在它已經被益百利收購了。Hitwise與一些互聯網服務公司合作,它支付給這些公司一些費用以使用它們的數據。這些數據隻是以一個固定的低價授權給Hitwise,而不是按它所得利潤的比例抽成。這樣一來,Hitwise作為中間人就得到了大部分的利潤。另一個中間人的例子就是Quantcast,它通過幫助網站記錄用戶的網頁瀏覽曆史來測評用戶的年齡、收入、喜好等個人信息,然後向用戶發送有針對性的定向廣告。它提供了一個在線係統,網站通過這個係統就能記錄用戶的瀏覽情況,而Quantcast就能得到這些數據來幫助自己提高定向廣告的效率。這些中間人在這個價值鏈中站在了一個收益豐厚的位置上,但是它們並沒有威脅到為他們提供數據的數據擁有者的利潤。現在,廣告業是一個高利潤行業,因為大部分的數據都藏身於此,而社會各行各業都急切地需要通過挖掘這些數據進行定向廣告。隨著越來越多的事情被數據化,越來越多的行業意識到它們與數據有交流,這些獨立的數據中間人也會在彆處出現。有時,這些中間人不一定是商業性質的組織,也可能是非營利性的,比如,2011年由美國幾個最大的醫療保險公司聯合創立的衛生保健成本協會(Health Care Cost Institute)。它們的數據彙集了來自3300萬人的50億份保單,當然這都是匿名的。數據共享之後,這些公司可以看到在一個較小的獨立數據庫裡看不到的信息。2008年9月,這個超大型數據庫就有了第一個重大發現,那就是美國的醫療花費比通貨膨脹率的增長速度快3倍之多。但是在各個細微方麵的情況就各有不同了:其中急診室治療費用上漲了11%,而護理設施的價格實際上是下跌了的。顯然,醫療保險公司是不可能把它的價格數據給除非營利性機構之外的任何組織的。這個組織的動機更明確,運行更透明化且更富有責任心。在Decide.的案例中,產品價格和新產品的發布數據都是由合作的網站提供的,然後合作雙方共同分享利潤。Decide.通過人們在這些網站購買產品而賺取傭金,同時提供這些數據的公司也取得了部分利潤。相比ITA提供給Farecast的數據不抽取傭金而隻是收取基本授權費用的情況,這說明了這個行業的逐漸成熟——如今數據提供者會更占優勢。不難想象,埃齊奧尼的下一個科技公司應該就會自己收集數據了,因為數據的價值已經從技術轉移到了數據自身和大數據思維上。上文提到的與供貨商進行知識產權交易的歐洲汽車製造商就擁有一個非常專業的數據分析團隊,但是還需要一個科技公司來替它挖掘數據的價值。這個科技公司肯定是可以得到報酬的,但是大頭還是被這個汽車製造商賺走了。不過,這個科技公司發現了商機,於是它改變了它的商業模式:它為客戶承擔一定的風險,因為有風險就有回報。而且,它用部分報酬換取了一部分的分析結果,因為這個分析結果是可以循環使用的。比如,對於汽車配件供應商來說,它們未來肯定都想為它們的產品加上測試儀或者把提供產品評估數據寫進銷售合同的標準條款中,這樣它們就能隨時改進產品的質量了。對於中間商來說,公司之間不願意進行數據共享的問題會讓他們感到很頭疼。比如Inrix就不再隻收集關於地理位置的數據了。2012年,它就關於車輛的自動製動係統何時何地會生效進行了分析,因為有一家汽車製造商用它的遙感勘測係統實時地收集了這些數據。它們認為如果車輛的自動製動係統在某段路上老是啟動的話,就說明這段路比較危險,應該考慮更換路徑。所以Inrix不僅能夠推薦最便捷的路徑,而且可以推薦最安全的路徑。但是這個製造商並不想和彆人分享這些數據,也不願分享它的全球定位係統收集到的數據。相反,它要求Inrix隻能在它生產的車上安裝這個係統。在製造商看來,公開這些數據似乎比彙聚眾人的數據一起來提高係統的整體精確性更有價值。但即便如此Inrix也相信,到最後,所有的汽車製造商都會意識到數據共享的好處。Inrix有一種強烈的樂觀精神:作為一個數據中間商,它的運行完全是依靠多種多樣的數據來源。大數據時代中的公司正在體驗著不同的商業模式。作為中間商的Inrix把它的工作重心放在了設計上,這與眾多科技創業公司的商業模式不同。微軟掌握著技術的核心專利,但是它卻認為,一個獨立的小公司可能更容易被接受,更有利於彙聚行業內各方的數據並從知識產權中獲利最大。還有,微軟用來分析病患再入住率的Amalga係統曾經就是華盛頓中心醫院自己的內部急症室軟件Azyxxi,這是醫院在2006年賣給微軟公司的,因為考慮到微軟更有能力把這個軟件做好和挖掘出這些數據的潛在價值。“2010年UPS就把它的UPS Logistics Teologies部門賣給了一家叫Thoma Bravo的私人股本公司。如今,它已經變成了Roadeologies,可以為多家公司進行線路分析。Road從客戶手中收集大量數據,同時為UPS和它的競爭者提供行業內廣受認可的標杆性服務。Road的首席執行官蘭·肯尼迪(Len Kennedy)解釋說,“如果是UPS Logistics,那麼UPS的競爭對手肯定不會交出它們的數據,因此,隻有讓它變成一個獨立的公司,UPS的競爭對手才會願意拿出它們的數據。”最終,每個公司都從中受益了,因為數據彙集之後,係統的精確性就更高了。”認為數據自身而不是技術和思維更值錢的想法,在大數據時代的多筆商業交易中都有所體現。2006年,微軟以1.1億美元的價格購買了埃齊奧尼的大數據公司Farecast。而兩年後,穀歌以7億美元的價格購買了為Farecast提供數據的ITA Software公司。在《點球成金》這部關於奧克蘭運動家棒球隊如何通過利用統計學和數學建模的方式分析數字,從而取得最終勝利的電影中,有一個有趣的場景,就是灰頭發的老球探們坐在一旁評論球員。觀眾不得不因此感到畏縮,不僅因為它體現了人類做決定時完全不依靠數據的草率,而且因為我們都經曆過這種依賴情感而不是科學進行判斷的情況。“一個球探說,“他不錯,有天賦……而且長得也不錯。””“一個滿頭白發、戴著助聽器的老人虛弱地附和道,“他擊打動作不錯,球一被碰到就一下子彈出去老遠。””“另一個球探也附和說,“擊打很大聲。””“有一個球探打斷了對話,說,“他女朋友真醜。””“會議的負責人說,“那是什麼意思?””“那個人似乎很肯定地說,“女朋友醜說明沒自信呀!””““很好!”負責人對回答很滿意,然後會議繼續。”“開了一會玩笑之後,一個一直沒說話的球探說,“這個人有很大的氣場。我的意思是,他還沒上場呢,對手就已經提前感受到了他的氣勢。””“另一個人附和道,“他通過了長相測試,長得不錯。他隨時都能打球,隻是需要點兒上場時間。””“那個常年持不讚同意見的人反複說,“我就是說說,他的女朋友真是長相平平。””這個場景完全展示了人類判斷的誤區。一個似乎經過了理智討論的事情其實是在沒有什麼實際標準的情況下做出的決定。簽約一個幾百萬美元年薪的球員,也隻是看感覺,沒有什麼客觀標準的。是的,這隻是電影中的場景,但是生活中這種情況也多得是。這個場景之所以具有諷刺意味,就是因為這是普遍存在的,從曼哈頓的會議室、美國總統辦公室到街角咖啡館,任何地方,這種空泛的推理都到處盛行。影片《點球成金》改編自邁克爾·劉易斯的《魔球——逆境中製勝的智慧》。講述的是一個真實的故事,介紹奧克蘭運動家棒球隊(又稱綠帽隊或白象隊)總經理比利·比恩(Billy Beane)的經營哲學,描寫了他拋棄幾百年一直依賴的選擇球員的傳統慣例,采用了一種依靠電腦程序和數學模型分析比賽數據來選擇球員的方法。他並沒有采用那些像“棒球擊球率”這樣傳統的標準,而是采用了看上去很奇怪的、類似“上壘率”這樣的標準。這個方法發現了這項體育賽事的另一麵,始終存在卻一直被忽略了的一麵。一個球員怎樣上壘並不要緊,不管是地滾球還是三壘跑,隻要他上壘了就夠了。當數據表明偷壘不實用的時候,即使這會讓比賽更有看頭,比利·比恩也不會再關注這種華而不實的技能。在一片批評與質疑聲中,比恩的“賽伯計量學”(Sabermetrics)在奧克蘭運動家棒球隊的辦公室裡被銘記了下來,這是以體育新聞記者比爾·詹姆斯(Bill James)在美國高級棒球研究協會(Society for Advanced Baseball Research)中的工作命名的。直到現在,美國高級棒球研究協會一直是一種奇特的亞文化的中心。比恩打破一切常規慣例,就如同伽利略用“太陽中心論”來挑戰天主教的權威一樣。最終,比恩帶領這支備受爭議的球隊在2002年的美國聯盟西部賽中奪得冠軍,還取得了20場連勝的戰績。從那以後,統計學家取代球探成為了棒球專家,很多其他球隊也開始爭相采用“賽伯計量學”來指導球隊運作。同樣地,人類從依靠自身判斷做決定到依靠數據做決定的轉變,也是大數據做出的最大貢獻之一。他們的判斷建立在相關關係的基礎上,沒有受到偏見和成見的影響,這就如同莫裡中校不把乾瘦的船長在酒吧喝酒時所說的航道信息當真一樣。他們的判斷完全依賴於彙集起來的數據所顯示出的實際信息,所以有著牢靠的根基。莫裡所采用的方法並沒有解釋風向和水流為什麼是這樣的原因,但是對於想安全航海的航海家來說,“什麼”和“哪裡”比“為什麼”更加重要。如今,我們正在見證專家在各個領域影響力的減弱。在傳媒界,如“赫芬頓郵報”(Huffington Post)和高客網(Gawker)這些網站上傳播的新聞通常取決於數據,而不再取決於編輯的新聞敏感度。數據比有經驗的記者更能揭示出哪些是符合大眾口味的新聞。Coursera,一家網上教育公司,深度地研究它收集的所有數據,比如學生重放過講座視頻的哪個片段,從而找出不明確或者很吸引人的地方,然後反饋給設計課程的團隊。這在以前是做不到的,所以老師的教育方法一定會改變。就像我們在前文提到過的,當貝索斯發現算法推薦能促進銷量增加的時候,他就不再使用公司的書籍評論員了。這都意味著,與時俱進才是在職業領域取得成功的必備技能;這樣的員工能隨時滿足公司對他們的期望。安大略的麥格雷戈醫生不需要是醫院裡最好的醫生,也不需要是產前護理的世界權威,就能給早產兒提供極好的治療,因為她采用的治療方法是電腦在處理了近十年的病患記錄數據之後推薦的。事實上,她也有計算機科學專業的博士學位。正如我們所見,大數據的先鋒們通常並不來自於他們做出了極大貢獻的領域。他們是數據分析家、人工智能專家、數學家或者統計學家,但是他們把他們所掌握的技能運用到了各個領域。Kaggle的首席執行官安東尼·戈德布魯姆(Anthony Goldbloom)說,在這個大數據項目競賽平台上取得勝利的人通常不來自於他們做出成績的領域。“一個英國物理學家設計了一個算法係統來預測保險索賠和發現二手車的質量問題,這個係統差點就獲勝了;還有一個新加坡的精算師在一個預測人體對化合物的生理反應項目中取得了勝利;同時,在穀歌的機器翻譯團隊中,這些工程師們都不會說他們翻譯出的語言;類似的還有,微軟機器翻譯部門的統計學家們在茶餘飯後的談資就是說每次一有語言學家離開他們團隊,翻譯的質量就會變好一點。”當然,行業專家是不會真正消亡的,隻是他們的主導地位會發生改變。未來,大數據人才會與他們一樣身居高位,就像趾高氣揚的因果關係必須與卑微的相關關係分享它的光芒一樣。這改變了我們怎樣看待知識的價值,因為我們往往傾向於把專業人才看得比全才更重要,也就是說深度就是財富。然而,專業技能就像精確性一樣,隻適用於“小數據”時代,當時人類掌握的數據永遠不夠多也不夠準確,所以需要依賴直覺和經驗指導。在那個時代,經驗是先決的,因為隻有通過這種無法從書本上和彆人口中得到的、埋藏在潛意識裡的知識的積累,我們才能做出更明智的決定。但是當你遭遇海量數據的時候,你就能通過挖掘數據而得到更多。所以大數據分析家會把過去看成是迷信和成規,這不是因為他們更聰明,而是因為他們擁有了這個財富之源——數據。同時,作為外行人,他們不會被行業內的爭論所限製,因為他們不會被自己所支持一方的觀點所影響而產生偏見,這是他們與行業專家不一樣的地方。這一切都意味著,一個員工是否對公司有貢獻的判斷標準改變了。這也就意味著,你要學的東西、你要了解的人,你要為你的職業生涯所做的準備都改變了。數學和統計學知識,甚至是有少許編程和網絡科學的知識將會成為現代工廠的基礎,一如百年前的計算能力或者更早之前的文學。人類的價值將不再體現在與思維類似的同行的交際上,而體現在與各行各業的人的交際上,因為這樣知識就能廣泛而深刻地進行傳播。過去,要成為一個優秀的生物學家就需要認識很多生物學家,這並沒有完全改變。但是如今,不隻是專業技能的深度很重要,大數據的廣度也變得很重要。要想解決一個生物難題,或許與天體物理學家或者數據視圖設計師聯係就可以實現。在電子遊戲領域,大數據的普通人才早已經和高級專家站在了一起,他們正在一同改變這個行業。該行業每年收入近100億美元,比好萊塢的票房收入還要多。過去,遊戲公司會設計一個遊戲,發布它,指望它能一炮而紅。然後,公司會考慮到銷售情況,要麼繼續推出升級版,要麼開始研發新遊戲。遊戲的速度、人物、情節、物品和事件的設定都是基於設計師的創造力,這些設計師對待工作的認真程度就像米開朗基羅畫西斯廷教堂時一樣。但是,這是一門藝術而不是科學,藝術講究的是直覺和情感,就像《點球成金》中球探們所表現的一樣,然而那個時代已經過去了。zynga的FarmVille,FrontierVille,FishVille和其他網絡遊戲都是交互式遊戲。表麵上,這些遊戲允許zynga收集用戶數據以及在這些數據的基礎上對遊戲進行修改,而事實上,這些遊戲遠遠不止一個版本。因為公司可以收集到遊戲中的數據,所以一旦有玩家難以過關或者因為某一關不對勁而不想再玩了的時候,zynga就能通過這些數據發現問題,然後對遊戲進行修改;但是更加隱性的是,該公司會針對不同的玩家設計不同的遊戲,像FarmVille就有好幾百個版本。“這個公司的大數據分析家們通過顏色或者是否有玩家看到他的朋友正在使用這些產品,來研究虛擬產品的銷量是否增加了。比方說,當數據顯示FishVille的玩家購買透明魚的數量是其他產品的6倍的時候,zynga就會通過多出售透明魚而謀取更高利潤。在Mafia Wars中,數據則顯示玩家更喜歡購買有金邊的武器和純白的寵物老虎。這些都不是一個遊戲設計師在工作室裡能發現的東西,但是數據就能把這些信息傳遞出來。zynga的首席分析師肯·魯丁說道,“我們打著遊戲公司的幌子,實際上在做的是分析公司的事。我們的運作都是以數據為基礎的。””這種轉變意義非凡。大部分人往往都通過經驗、回憶以及猜測做決定,就像W.H.奧登(Wystan Hugh Auden)的名詩中所說的“知識退化成騷亂的主觀臆想,那是太陽神經叢的感情引起的營養不足”。坐落於馬薩諸塞州的巴布森學院商科教授托馬斯·達文波特(Thomas Davenport)是多部數據分析著作的作者,他把這種情感稱為“黃金般的直覺”。執行官們信任自己的直覺,所以由著它做決定。但是,隨著管理決策越來越受預測性分析和大數據分析的影響和控製,依靠直覺做決定的情況將會被徹底改變。從是否出品一部電影到簽下哪個三壘手,公司的決策過程已經有了本質且明顯的改變。麻省理工學院商學院教授埃裡克·布倫喬爾森(Erik Brynjolfsson)和他的同事一起進行了一項研究,發現決策依賴數據的公司的運營情況比不重視數據的公司出色很多——這些公司的生產率比不使用數據進行決策的公司高6%。這是一個重要的競爭力,雖然隨著大數據手段被越來越多的公司采用,這種競爭力會慢慢削弱。大數據成為許多公司競爭力的來源,從而使整個行業結構都改變了。當然,每個公司的情況各有不同。大公司和小公司最有可能成為贏家,而大部分中等規模的公司則可能無法在這次行業調整中嘗到甜頭。雖然像亞馬遜和穀歌一樣的行業領頭羊會一直保持領先地位,但是和工業時代不一樣,它們的企業競爭力並不是體現在龐大的生產規模上。已經擁有的技術配備規模固然很重要,但那也不是它們的核心競爭力,畢竟如今已經能夠快速而廉價地進行大量的數據存儲和處理了。公司可以根據實際需要調整它們的計算機技術力量,這樣就把固定投入變成了可變投入,同時也削弱了大公司的技術配備規模的優勢。大數據向小數據時代的贏家以及那些線下大公司(如沃爾瑪、聯邦快遞、寶潔公司、雀巢公司、波音公司)提出了挑戰,後者必須意識到大數據的威力然後有策略地收集和使用數據。同時,科技創業公司和新興行業中的老牌企業也準備收集大量的數據。在過去十年裡,航空發動機製造商勞斯萊斯通過分析產品使用過程中收集到的數據,實現了商業模式的轉型。坐落於英格蘭德比郡的勞斯萊斯運營中心一直監控著全球範圍內超過3700架飛機的引擎運行情況,為的就是能在故障發生之前發現問題。數據幫助勞斯萊斯把簡單的製造轉變成了有附加價值的商業行為:勞斯萊斯出售發動機,同時通過按時計費的方式提供有償監控服務(一旦出現問題,還進一步提供維修和更換服務)。如今,民用航空發動機部門大約70%的年收入都是來自其提供服務所賺得的費用。大數據也為小公司帶來了機遇。用埃裡克教授的話說就是,聰明而靈活的小公司能享受到非固有資產規模帶來的好處。這也就是說,它們可能沒有很多的固有資產但是存在感非常強,也可以低成本地傳播它們的創新成果。重要的是,因為最好的大數據服務都是以創新思維為基礎的,所以它們不一定需要大量的原始資本投入。數據可以授權但是不能被占有,數據分析能在雲處理平台上快速而且低成本地進行,而授權費用則應從數據帶來的利益中抽取一小部分。大大小小的公司都能從大數據中獲利,這個情況很有可能並不隻是適用於使用數據的公司,也適用於掌握數據的公司。大數據擁有者想儘辦法想增加它們的數據存儲量,因為這樣能以極小的成本帶來更大的利潤。首先,它們已經具備了存儲和處理數據的基礎。其次,數據庫的融合能帶來特有的價值。最後,數據使用者如果隻需要從一人手中購得數據,那將更加省時省力。不過實際情況要遠遠複雜得多,可能還會有一群處在另一方的數據擁有者(個人)誕生。因為隨著數據價值的顯現,很多人會想以數據擁有者的身份大展身手,他們收集的數據往往是和自身相關的,比如他們的購物習慣、觀影習慣,也許還有醫療數據等。這使得消費者擁有了比以前更大的權利。消費者可以自行決定把這些數據中的多少授權給哪些公司。當然,不是每個人都隻在乎把他的數據賣個高價,很多人願意免費提供這些數據來換取更好的服務,比如想得到亞馬遜更準確的圖書推薦。但是對於很大一部分對數據敏感的消費者來說,營銷和出售他們的個人信息就像寫博客、發Twitter信息和在維基百科檢索一樣自然。然而,這一切的發生不隻是消費者意識和喜好的轉變所能促成的。現在,無論是消費者授權他們的信息還是公司從個人手中購得信息都還過於昂貴和複雜。這很可能會催生出一些中間商,它們從眾多消費者手中購得信息,然後賣給公司。如果成本夠低,而消費者又足夠信任這樣的中間商,那麼個人數據市場就很有可能誕生,這樣個人就成功地成為了數據擁有者。美國麻省理工學院媒體實驗室的個人數據分析專家桑迪·彭特蘭與人一起創辦的ID3公司已經在致力於讓這種模式變為現實。隻有當這些數據中間商誕生並開始運營,而數據使用者也開始使用這些數據的時候,消費者才能真正變成數據掌握者。如今,消費者在等待足夠的設備和適當的數據中間商的出現,在這之前,他們希望自己披露的信息越少越好。總之,一旦條件成熟,消費者就能從真正意義上成為數據掌握者了。不過,大數據對中等規模的公司幫助並不大。波士頓谘詢集團的資深技術和商業顧問菲利浦·埃文斯(Philip Evans)說,超大型的公司占據了規模優勢,而小公司則具有靈活性。在傳統行業中,中等規模的公司比大公司更有靈活性,比小公司更有規模。但是在大數據時代,一個公司沒必要非要達到某種規模才能支付它的生產設備所需投入。大數據公司發現它們可以是一個靈活的小公司並且會很成功(或者會被大數據巨頭並購)。大數據也會撼動國家競爭力。當製造業已經大幅轉向發展中國家,而大家都爭相發展創新行業的時候,工業化國家因為掌握了數據以及大數據技術,所以仍然在全球競爭中占據優勢。不幸的是,這個優勢很難持續。就像互聯網和計算機技術一樣,隨著世界上的其他國家和地區都開始采用這些技術,西方世界在大數據技術上的領先地位將慢慢消失。對於發達國家的大公司來說,好消息就是大數據會加劇優勝劣汰。所以一旦一個公司掌握了大數據,它不但有可能超過它的對手,還有可能遙遙領先。不過,就算有這麼多好處,我們依然有擔憂的理由。因為隨著大數據能夠越來越精確地預測世界的事情以及我們所處的位置,我們可能還沒有準備好接受它對我們的隱私和決策過程帶來的影響。我們的認知和製度都還不習慣這樣一個數據充裕的時代,因為它們都建立在數據稀缺的基礎之上。下一個章節,我們將探討大數據所帶來的不良影響。
06 角色定位:數據、技術與思維的三足鼎立(1 / 1)