誠邀。
摘要:“不僅是早期的內容,互聯網的大部分內容都沒有保存。”
2005年,還是學生的亞歷克斯·圖(AlexTew)想出了一個賺100萬美元的點子。
時年20歲的他正在天馬行空地想怎么才能支付一個商科學位迫在眉睫的3年學費。亞歷克斯·圖擔心自己的透支金額會迅速增加。于是他在便箋簿上潦草地寫道:“如何成為百萬富翁?!?/p>
20分鐘后,他找到了自認為的答案。
亞歷克斯·圖創建了一個名為“百萬美元主頁”(MillionDollarHomepage)的網站。該網站的模式極其簡單:上面是100萬像素的廣告位,以10×10像素為基本單位銷售,每個像素售價1美元。你一旦購買,它們就永遠屬于你。售出第100萬個像素時,亞歷克斯·圖就會成為百萬富翁。至少,計劃是這樣的。
在亞歷克斯·圖花了50歐元注冊域名并設定主頁后,百萬美元主頁網站于2005年8月26日開通。廣告商購買頁面上的像素,并提供鏈接、小圖案和少量文字信息,鼠標停留在廣告商的圖案上時文字就會顯示,點擊后就可進入鏈接的網站。
由于口耳相傳和媒體關注度不斷提高,剛一個月多一點,亞歷克斯·圖的主頁廣告銷售就超過25萬美元(14萬英鎊)。2006年1月,最后1000個像素在拍賣會上以38100美元(21500英鎊)的價格售出。亞歷克斯·圖真的賺了100萬美元。
創建近15年后,這個百萬美元主頁還在網上。很多客戶,包括英國《泰晤士報》(TheTimes)、旅游服務網站Cheapflights.com、在線門戶網站雅虎(Yahoo!)和雙人搖滾組合TenaciousD等在完成了一次性付費后已經打了15年的廣告。該網站每天仍有幾千名訪客,這可能是一筆非常劃算的投資。
現在,百萬美元主頁上的很多鏈接指向的網站都已不復存在(Credit:MillionDollarHomepage)
亞歷克斯·圖真的成了百萬富翁。他現在運營著冥想和正念應用程式Calm。但他創建的那個主頁也變成了另一種東西:一個記錄早期互聯網時代的活的博物館。15年看上去可能并不長,但就互聯網而言,就像是一個地質年代。在百萬像素主頁上,現在大約40%的鏈接指向的網站已經不復存在,其他鏈接中很多指向全新的域名,因為原來的URL已賣給了新的所有者。
百萬美元主頁表明,互聯網早期的衰變幾乎是無跡可尋。在現實世界中,比如,一家地方報紙的倒閉往往會被廣泛報道。但在線網站的消亡通常都悄無聲息,只有當點擊的鏈接指向一個空白頁面時,你才知道它們已經不存在了。
大約10年前,我花了兩年的功夫維持一個搖滾音樂博客和現在屬于美國電話公司Verizon旗下的大型互聯網先驅美國在線(AOL)的音樂頻道。我編輯或撰寫了數百篇現場評論、音樂新聞報道、音樂人采訪和清單體文章。Facebook和Twitter已經吸引了海量用戶,智能手機連接了我們與工作和家庭之間的網絡,上網成了一項不分晝夜的活動。
你完全有理由認為,如果需要證明花在那上面的時間,我只要用谷歌(Google)搜索一下就可以了。但你錯了。2013年4月,美國在線突然關閉旗下所有音樂網站,以及數十位編輯和數百位撰稿人共同努力多年的成果。除了互聯網檔案館(InternetArchive)保存的少量文章外,其余所剩無幾?;ヂ摼W檔案館是一個總部位于舊金山的非盈利基金會,由計算機工程師布魯斯特·卡爾(BrewsterKahle)于上世紀90年代末創辦。
全球有一系列機構試圖在人類互聯網出現頭十年最后的痕跡完全消失之前挽救出其中的一部分,互聯網檔案館是其中最有名的。
南安普敦大學網絡科學研究所(WebScienceInstituteattheUniversityofSouthampton)常務所長達姆·溫迪·霍爾(DameWendyHall)明白無誤地肯定互聯網檔案館的貢獻。她說,互聯網早期的內容“如果不是這個檔案館,就一點不剩了。如果布魯斯特·卡爾不創辦互聯網檔案并開始保存,沒有等任何人的許可,我們現在什么也沒有?!?/p>
2013年,美國在線關閉旗下多個音樂網站,刪除了多年間來自世界各地的音樂報道(Credit:GettyImages)
達姆·溫迪說,檔案館和國家圖書館有保存書籍、報紙和期刊的經驗,因為印刷品已經存在很長時間了。但互聯網的誕生,以及它成為大眾交流和表達方式的速度之快,可能讓檔案館和國家圖書館出乎意外。從那之后,在很多領域,對互聯網進行存檔的嘗試一直在盡力追趕。她說:“出版的所有地方報紙,大英圖書館(BritishLibrary)都不得不保存一份?!彪S著報紙從紙媒走向網絡,存檔工作的形式也發生了變化。這些網站和之前的報紙一樣,是重要的信息資源嗎?
報紙存檔也非常重要。報紙停刊或與其他刊物合并時,報紙也容易丟失。她說:“大部分報紙,我想都會有某種分類或存檔。但如果不妥善存檔保管,這些信息也可能丟失。”
試圖對互聯網進行存檔有一個主要問題是,它從來都不是靜止不動的。每一分每一秒,網上的照片、博客文章、視頻、新聞報道和評論都會增加。盡管數字存儲的價格已經大幅下降,但對所有這些內容存檔依然要花經費?!罢l來出錢?”達姆·溫迪問?!拔覀儺a生的東西比過去多得太多了?!?/p>
在英國,數字保存的工作部分落到了大英圖書館肩上。該圖書館有一個英國網絡檔案館(UKWebArchive),從2004年開始獲準收集網站信息。該檔案館的項目經理韋伯(JasonWebber)說,這個問題比大多數人以為的要大得多。
互聯網初期,也就是留言板和網吧時代保留下來的內容非常少(Credit:GettyImages)
他說:“不僅是早期的內容,互聯網的大部分內容都沒有保存?!?/p>
“互聯網檔案館是從1996年開始保存各網站的網頁。那時距離第一批網頁創建已經過去了5年。那個曾經從網絡復制過來的時代已蕩然無存?!本瓦B1991年創建的全球首個網頁也已經不復存在。人們在萬維網聯盟(WorldWideWebConsortium)上看到的頁面是一年后制作的副本。
在互聯網誕生后的最初5年里,很多時候在英國發布的很多內容都以.ac.uk的指定代碼域名結尾,表示是學者撰寫的學術文章。直到1996年,隨著商業網站的數量開始超過學術網站數,互聯網上才開始出現更多的綜合性網站。
大英圖書館每年都會進行一次“網站領域系統搜尋”,以保存在英國發表的任何信息。“我們努力把所有內容都存下來,可我們一年只能做一次。但大量網站的儲存量上限被設置為500MB,這可以涵蓋很多小網站,但是你只能存幾個視頻,很快就會達到上限?!比欢馚BC新聞這樣的新聞網站確實會獲得較多次數的系統搜尋。韋伯說,大英圖書館嘗試盡可能全面地保存英國脫歐、2012年倫敦奧運會和一戰100周年紀念等事件的信息。
韋伯說:“我覺得我們對一切都會失去的認知非常低。數字世界短暫無常,我們看著手機,其實還沒有思考,手機上的東西就變了。不過現在人們越來越意識到我們可能正在失去很多東西。”
但韋伯說,像大英圖書館這樣的機構只有權收集可公開瀏覽的內容,數量更大的重要歷史和和文化數據存儲在人們自己的的檔案中,比如硬盤。但我們很少有人把這些留給后代。
“大英圖書館保存了大量個人之間的信件。有政客之間的往來信件,也有情書,這些東西對一些人來說真的很重要?!?/p>
檔案館知道保存報紙的重要性,但對網絡內容的出現卻反應遲鈍(Credit:GettyImages)
我們以為自己發表在社交網絡上的內容會永遠存在,只需要敲一下鍵盤就能看到。但最近,具有開創性的社交網站MySpace(曾經在美國最受歡迎的網站)最近丟失了大約12年的音樂和照片。這表明,即使是存儲在最大網站上的內容,可能也不安全。
即便是搜索巨頭谷歌的服務也不能幸免。谷歌試圖與Facebook抗衡的社交網絡Google+于4月2日關閉。但是否所有用戶都備份了發表在Google+上的照片和記憶?
韋伯說:“把照片放在Facebook上并不是存檔,因為有一天Facebook也會不復存在。”如果對網絡的暫時性有任何懷疑,花幾分鐘瀏覽一下百萬美元主頁。它證明了我們的網絡歷史會消失得有多快。
數據丟失還有另外一面。達姆·溫迪指出,不把新聞網站上的報道存檔可能會造成片面的歷史觀,比如,新政府選擇不保存有關自己的負面報道或檔案。
倫敦大學(UniversityofLondon)數字人文學科教授溫特斯(JaneWinters)說:“一旦政府換屆或半官方機構重組,網站就會被關閉。或者看看競選網站,其本質上就是臨時性的?!?/p>
有時候,網站消失是伴隨社會的大變革發生的,比如國家本身的誕生和滅亡。她說:“南斯拉夫(Yugoslavia)就是這樣。yu曾是代表南斯拉夫的域名,但南斯拉夫解體后,這種情況隨之結束。一位研究人員正在嘗試恢復南斯拉夫解體前的內容?!?/p>
“政治常常與技術緊密相連?!?/p>
也許有一線希望?!拔沂茄芯繗v史的,我們一向要克服歷史記錄中的空白,這些空白有些我們知道,有些我們根本不知道?!?/p>
達姆·溫迪·霍爾認為與物質世界也有相似之處。60年代末,15歲的她作為觀眾參與了BBC的音樂節目《流行之巔》(TopofthePops)的錄制。
節目在圣誕節那天播出?!半娨曢_著,我母親說‘你在那兒!’但我錯過了。后來我去了BBC,想得到一份拷貝。他們把它錄下來了??晌覐膩頉]看到過?!?/p>
來源:BBC
作者:斯蒂芬·道林(StephenDowling)
原標題:早期互聯網歷史存檔內容為何如此之少?