Wayback Machine - Wayback Machine

Z Wikipédie, Voľnej Encyklopédie

Pin
Send
Share
Send

Wayback Machine
Štylizovaný text s nápisom: „STROJ NA SPÄTNÚ ARCHÍV INTERNETU“. Text je čierny, okrem „WAYBACK“, ktorý je červený.
Screenshot
20151221 Internetový archív Wayback Machine.png
Vizualizácia archívov wikipedia.org na stroji Wayback Machine (december 2015)
Typ stránky
Archív
Plocha slúžilaPo celom svete (okrem Číny a Ruska)
MajiteľInternetový archív
URLweb.archív.org Upravte to na Wikidata
RegistráciaVoliteľné
Spustené24. októbra 2001; Pred 19 rokmi (2001-10-24)[1][2]
Súčasný stavAktívny
Napísané vJava, Python

The Wayback Machine je digitál archív z World Wide Web, ktorú založila Internetový archív, nezisková knižnica so sídlom v San Francisco. Umožňuje používateľovi vrátiť sa „v čase“ a pozrieť sa, ako vyzerali webové stránky v minulosti. Jej zakladatelia, Brewster Kahle a Bruce Gilliat, vyvinula Stroj Wayback s úmyslom poskytnúť „univerzálny prístup ku všetkým vedomostiam“ uchovaním archivovaných kópií zaniknutých webových stránok.

Od spustenia v roku 2001 bolo do archívu pridaných viac ako 463 miliárd stránok. Táto služba tiež vyvolala polemiku o tom, či predstavuje vytváranie archivovaných stránok bez súhlasu vlastníka porušenie autorských práv v určitých jurisdikciách.

História

Internetový archív zakladatelia Brewster Kahle a Bruce Gilliat uviedla v roku 2001 Wayback Machine na riešenie problému zmiznutia obsahu webových stránok vždy, keď sa zmení alebo vypne.[3] Táto služba umožňuje používateľom zobraziť archivované verzie servera internetové stránky v čase, ktorý archív nazýva „trojrozmerný index“.[4] Kahle a Gilliat vytvorili stroj v nádeji, že archivujú celý internet a poskytujú „univerzálny prístup ku všetkým vedomostiam“.[5]

Názov Wayback Machine bol vybraný ako odkaz na fiktívny cestovanie v čase zariadenie, „Wayback Machine„(vyslovuje sa cesta späť), ktoré používajú znaky Pán Peabody a Sherman v animovanej karikatúre Rocky and Bullwinkle Show zo 60. rokov.[6][7] V jednom zo segmentov komponentov animovanej karikatúry Peabodyova nepravdepodobná história, postavy bežne používali stroj na sledovanie, účasť na slávnych udalostiach v dejinách a ich časté pozmeňovanie.

Stroj Wayback Machine začal archivovať cacheovaný v máji 1996,[8][9] s cieľom zverejniť službu o päť rokov neskôr.[10] Od roku 1996 do roku 2001 sa informácie uchovávali na digitálnej páske, pričom Kahle občas umožňovala výskumníkom a vedcom preniknúť do neohrabaného databázy.[11] Keď archív v roku 2001 dosiahol svoje piate výročie, bol odhalený a otvorený pre verejnosť slávnostným ceremoniálom v Kalifornská univerzita v Berkeley.[12] V čase, keď bol stroj Wayback uvedený na trh, obsahoval už viac ako 10 miliárd archivovaných stránok.[13]

Dnes sú údaje uložené na veľkom zhluku internetového archívu Linux uzly.[5] Príležitostne znovu navštevuje a archivuje nové verzie webových stránok (technické podrobnosti nájdete nižšie).[14] Stránky je tiež možné zachytiť manuálne zadaním ich webových stránok URL do vyhľadávacieho poľa za predpokladu, že webová stránka umožňuje stroju Wayback Machine „indexové prehľadanie“ a uloženie údajov.[10]30. októbra 2020 začala spoločnosť Wayback Machine kontrolovať obsah.[15]

Technické detaily

Softvér bol vyvinutý pre „plaziť sa“ web a sťahovať všetky verejne prístupné stránky WWW, Gopher hierarchia, Netnews Systém (Usenet) vývesiek a softvér na stiahnutie.[16] Informácie zhromaždené týmito „prehľadávačmi“ nezahŕňajú všetky informácie dostupné na internete, pretože väčšinu údajov obmedzuje vydavateľ alebo sú uložené v databázach, ktoré nie sú prístupné. S cieľom prekonať nezrovnalosti na webových stránkach čiastočne uložených v medzipamäti bol server Archive-It.org vyvinutý v roku 2005 internetovým archívom ako prostriedok umožňujúci inštitúciám a tvorcom obsahu dobrovoľne zbierať a uchovávať zbierky digitálneho obsahu a vytvárať digitálne archívy.[17]

Indexové prehľadávanie prispieva z rôznych zdrojov, z ktorých niektoré sú importované od tretích strán a iné interne generované archívom.[14] Napríklad indexovým prehľadávaním prispieva Nadácia Sloan a Alexa, prehľadáva spustené IA v mene používateľa NARA a Internet Memory Foundationzrkadlá Spoločné prechádzanie.[14] „Celosvetové prehľadávanie webu“ funguje od roku 2010 a zachytáva globálny web.[14][18]

Frekvencia snímok sa líši podľa jednotlivých webových stránok.[14] Webové stránky v zozname „Celosvetové indexové prehľadávanie webu“ sú zahrnuté v „zozname prehľadávania“ a tieto stránky sa archivujú raz za každé indexové prehľadávanie.[14] Dokončenie indexového prehľadávania môže trvať mesiace alebo dokonca roky, v závislosti od veľkosti.[14] Napríklad „Wide Crawl Number 13“ sa začalo 9. januára 2015 a skončilo sa 11. júla 2016.[19] Môže však súčasne prebiehať niekoľko indexových prehľadávaní a stránka môže byť zahrnutá do viac ako jedného zoznamu indexového prehľadávania, takže frekvencia indexového prehľadávania stránky sa veľmi líši.[14]

Od októbra 2019 sú používatelia obmedzený do 5 archívnych žiadostí a vyhľadávaní za minútu.[prečo?]

Skladovacia kapacita a rast

S postupným vývojom technológií sa kapacita úložného priestoru stroja Wayback Machine rozrástla. V roku 2003, po iba dvoch rokoch verejného prístupu, stroj Wayback Machine rástol tempom 12 terabajtov za mesiac. Údaje sú uložené na PetaBox regálové systémy na mieru navrhnuté zamestnancami Internetového archívu. Prvý 100TB stojan začal byť plne funkčný v júni 2004, aj keď sa čoskoro ukázalo, že budú potrebovať oveľa viac úložného priestoru.[20][21]

Internetový archív migroval svoju prispôsobenú architektúru úložiska na Sun Open Storage v roku 2009 a hostí nové dátové centrum v a Modulárne dátové centrum Sun na Sun Microsystems„Areál Kalifornie.[22] Od roku 2009, Stroj Wayback Way obsahoval približne tri petabajty dát a rástol tempom 100 terabajtov každý mesiac.[23]

V roku 2011 bola pre verejné testovanie sprístupnená nová vylepšená verzia stroja Wayback Machine s aktualizovaným rozhraním a sviežejším indexom archivovaného obsahu.[24] V marci toho roku sa na fóre Wayback Machine povedalo, že „Beta nového stroja Wayback Machine obsahuje úplnejší a aktuálnejší index všetkých prehľadávaných materiálov do roku 2010 a bude sa pravidelne pravidelne aktualizovať. jazda na klasickom stroji Wayback Machine má po roku 2008 len trochu materiálu a ďalšie aktualizácie indexu sa neplánujú, pretože budú tento rok postupne ukončené. “[25] Aj v roku 2011 nainštaloval Internetový archív šiesty pár regálov PetaBox, čím sa zvýšila úložná kapacita stroja Wayback Machine o 700 terabajtov.[26]

V januári 2013 spoločnosť oznámila priekopnícky míľnik 240 miliárd adries URL.[27]

V októbri 2013 spoločnosť predstavila funkciu „Uložiť stránku“[28][29] ktorý umožňuje každému používateľovi internetu archivovať obsah adresy URL a rýchlo generuje a trvalý odkaz na rozdiel od predchádzajúceho liveweb vlastnosť.

To sa stalo hrozbou zneužitia službou pre hosting škodlivých binárnych súborov.[30][31]

Od decembra 2014, Wayback Machine obsahoval 435 miliárd webové stránky - takmer deväť petabajtov dát a rástol asi o 20 terabajtov týždenne.[13][32][33]

Od júla 2016, Stroj Wayback údajne obsahoval okolo 15 petabajtov dát.[34]

Od septembra 2018 obsahoval stroj Wayback Machine viac ako 25 petabajtov dát.[35][36]

Wayback strojový rast[37][38]
Wayback Machine podľa rokuArchivované stránky (miliardy)
2005
40
2008
85
2012
150
2013
373
2014
400
2015
452

Pravidlá vylúčenia webových stránok

Spoločnosť Wayback Machine historicky rešpektovala štandard vylúčenia robotov (robots.txt) pri určovaní, či by sa mala webová stránka prehľadávať; alebo ak už je prehľadaný, či by boli jeho archívy verejne viditeľné. Majitelia webových stránok mali možnosť deaktivovať Wayback Machine pomocou súboru robots.txt. Aplikovala pravidlá robots.txt spätne; ak web zablokoval internetový archív, všetky predtým archivované stránky z domény sa tiež okamžite stali nedostupnými. Internetový archív navyše uviedol, že „Niekedy nás vlastník webových stránok bude kontaktovať priamo a požiada nás, aby sme prestali indexovo prehľadávať alebo archivovať stránky. Týmto požiadavkám vyhovieme.“[39] Okrem toho web hovorí: „Internetový archív sa nezaujíma o uchovanie alebo ponúknutie prístupu na webové stránky alebo k iným internetovým dokumentom osôb, ktoré nechcú, aby ich materiály boli v zbierke.“[40][41]

17. apríla 2017 sa objavili správy o weboch, ktoré zanikli a stali sa nefunkčnými zaparkované domény ktorí sa pomocou súboru robots.txt vylúčili z vyhľadávacích nástrojov, čo malo za následok ich neúmyselné vylúčenie z Wayback Machine.[42] Internetový archív zmenil túto politiku tak, že teraz vyžaduje výslovnú žiadosť o vylúčenie, aby bola odstránená zo zariadenia Wayback Machine.[43]

Politika archívu v Oaklande

Politika spätného vylúčenia spoločnosti Wayback je čiastočne založená na Odporúčania pre správu požiadaviek na odstránenie a zachovanie integrity archívu publikovaná Školou informačného riadenia a systémov na adrese Kalifornská univerzita v Berkeley v roku 2002, ktorá dáva vlastníkovi webových stránok právo zablokovať prístup k archívom týchto webových stránok.[44] Spoločnosť Wayback dodržala túto politiku, aby sa vyhla nákladným súdnym sporom.[45]

Politika spätného vylúčenia spoločnosti Wayback sa začala uvoľňovať v roku 2017, keď prestala ctiť súbor robots.txt na webových stránkach vlády a vojenských serverov USA pre prehľadávanie aj zobrazovanie webových stránok. Od apríla 2017 spoločnosť Wayback ignoruje súbor robots.txt širšie, nielen pre webové stránky vlád USA.[46][47][48][49]

Používa

Od svojho prvého uvedenia na trh v roku 2001 vedci študovali stroj Wayback Machine z hľadiska spôsobov ukladania a zhromažďovania údajov, ako aj skutočných stránok v archíve. Do roku 2013 napísali vedci asi 350 článkov o stroji Wayback Machine, väčšinou z oblasti informačných technológií, knižnice a sociálnych vied. Vedci v oblasti spoločenských vied použili stroj Wayback Machine na analýzu toho, ako vývoj webových stránok od polovice 90. rokov do súčasnosti ovplyvnil rast spoločnosti.[13]

Keď Wayback Machine archivuje stránku, zvyčajne obsahuje väčšinu hypertextových odkazov, čím tieto odkazy zostávajú aktívne, keď by rovnako ľahko mohli byť narušené nestabilitou internetu. Vedci v Indii študovali účinnosť schopnosti stroja Wayback Machine ukladať hypertextové odkazy v online vedeckých publikáciách a zistili, že ich ušetrila o niečo viac ako polovica.[50]

"Novinári používajú Wayback Machine na prezeranie mŕtvych webov, datovaných správ a zmien v obsahu webov. Jeho obsah bol použitý na vyvodenie zodpovednosti voči politikom a na odhalenie klamstiev na bojiskách."[51] V roku 2014 bola archivovaná stránka sociálnych médií v doméne Igor Girkin, vodca separatistických povstalcov na Ukrajine, mu ukázal, ako sa chváli tým, ako jeho jednotky zostrelili podozrivé ukrajinské vojenské lietadlo predtým, ako sa dozvedelo, že lietadlo bolo skutočne civilným prúdom spoločnosti Malaysian Airlines (Let spoločnosti Malaysia Airlines 17), po čom príspevok vymazal a z prepadu lietadla obvinil ukrajinskú armádu.[51][52] V roku 2017 Pochod za vedu vznikol z diskusie dňa reddit , ktorá naznačovala, že niekto navštívil stránku Archive.org a zistil, že všetky odkazy na zmena podnebia boli odstránené z webovej stránky Bieleho domu. Používateľ v reakcii uviedol: „Je potrebné, aby sa konal Pochod vedcov vo Washingtone.“[53][54][55]

Ďalej je web veľmi využívaný na overovanie, ktoré poskytuje prístup k referenciám a tvorbe obsahu používateľom Redaktori Wikipedia.[56]

V septembri 2020 bolo ohlásené partnerstvo s Oblačnosť automaticky archivovať webové stránky poskytované prostredníctvom jej služby „Vždy online“, ktorá mu tiež umožní nasmerovať používateľov na jeho kópiu stránok, ak sa nemôže dostať k pôvodnému hostiteľovi.[57]

Obmedzenia

V roku 2014 uplynulo šesťmesačné oneskorenie medzi prehľadaním webovej stránky a sprístupnením na prezeranie v Wayback Machine.[58] V súčasnosti je doba oneskorenia 3 až 10 hodín.[59] Wayback Machine ponúka iba obmedzené možnosti vyhľadávania. Funkcia „Vyhľadávanie na stránkach“ umožňuje používateľom vyhľadať web na základe slov, ktoré ho popisujú, a nie na slovách samotných.[60]

Stroj Wayback Machine nezahŕňa všetky webové stránky, ktoré boli kedy vyrobené, kvôli obmedzeniam jeho webového prehľadávača. Stroj Wayback Machine nemôže úplne archivovať webové stránky, ktoré obsahujú interaktívne prvky, ako sú platformy Flash a formuláre napísané v jazykoch JavaScript a progresívne webové aplikácie, pretože tieto funkcie vyžadujú interakciu s hostiteľským webom. To znamená, že od júna 2013 nedokáže Wayback Machine pri ukladaní stránok YouTube zobraziť komentáre YouTube, pretože podľa Archívneho tímu sa komentáre už „nenačítavajú na samotnú stránku“.[61] Webový prehľadávač Wayback Machine má ťažkosti s extrahovaním všetkého, čo nie je kódované v HTML alebo v niektorom z jeho variantov, čo môže často viesť k nefunkčným hypertextovým odkazom a chýbajúcim obrázkom. Z tohto dôvodu nemôže webový prehľadávač archivovať „osirelé stránky“, ktoré neobsahujú odkazy na iné stránky.[60][62] Prehľadávač Wayback Machine sleduje iba vopred určený počet hypertextových odkazov na základe vopred nastaveného limitu hĺbky, takže nemôže archivovať každý hypertextový odkaz na každej stránke.[18]

Od apríla 2018 administratívni pracovníci archívneho tímu stroja Wayback Machine presadili pravidlo štvrťroka občasným vymazaním časových intervalov 23 dní alebo 39 dní (3/4, respektíve 5/4 mesiaca), aby zmenšiť veľkosť frontu.[potrebná citácia]

V právnych dôkazoch

Civilný spor

Netbula LLC v. Chordiant Software Inc.

V prípade z roku 2009 Netbula, LLC v. Chordiant Software Inc., obžalovaný Chordiant podal návrh na prinútenie Netbula, aby zakázal robots.txt Súbor na svojej webovej stránke, ktorý spôsoboval, že stroj Wayback Machine so spätnou platnosťou odstránil prístup k predchádzajúcim verziám stránok, ktoré archivoval z webu Netbuly, stránky, o ktorých sa Chordiant domnieval, že podporia jeho prípad.[63]

Spoločnosť Netbula namietala proti návrhu z dôvodu, že obžalovaní žiadajú o zmenu webovej stránky spoločnosti Netbula a že mali priamo k týmto stránkam predvolať internetový archív.[64] Zamestnanec Internetového archívu podal čestné vyhlásenie podporujúce návrh Chordiantu s tým, že nemôže vytvárať webové stránky žiadnym iným spôsobom „bez značnej záťaže, výdavkov a narušenia jeho činnosti“.[63]

Sudca sudcu Howard Lloyd v severnom kalifornskom okrese San Jose Division odmietol argumenty Netbuly a nariadil im dočasne deaktivovať blokovanie súboru robots.txt, aby umožnil spoločnosti Chordiant získať archivované stránky, ktoré hľadali.[63]

Telewizja Polska

V prípade z októbra 2004 Telewizja Polska USA, Inc. v. Echostar Satellite, Č. 02 C 3293, 65 Fed. R. Evid. Podávame. 673 (N.D. Ill. 15. októbra 2004), účastník sporu sa pokúsil použiť archívy stroja Wayback Machine ako zdroj prípustných dôkazov, možno prvýkrát. Telewizja Polska je poskytovateľom služieb TVP Polonia a EchoStar prevádzkuje Dish Network. Pred skúšobným konaním spoločnosť EchoStar uviedla, že má v úmysle ponúknuť snímky spoločnosti Wayback Machine ako dôkaz o minulom obsahu webovej stránky Telewizja Polska. Telewizja Polska priniesla návrh v limine potlačiť snímky na základe počutie a neoverený zdroj, ale sudca magistrátu Arlander Keys odmietol tvrdenie spoločnosti Telewizja Polska o počutí a poprel návrh TVP v limine na vylúčenie dôkazov pri súdnom konaní.[65][66] Na pojednávaní však sudca okresného súdu Ronald Guzman, rozhodca pojednávania, potvrdil závery sudcu Keysa a rozhodol, že ani čestné vyhlásenie zamestnanca Internetového archívu, ani príslušné stránky (t. J. Webová stránka Telewizja Polska) nie sú prípustné ako dôkaz. Sudca Guzman usúdil, že čestné vyhlásenie zamestnanca obsahovalo jednak počutie, jednak nepresvedčivé podporné vyhlásenia a že údajná webová stránka nevytvára autentifikáciu.[67][68]

Patentové právo

Za predpokladu, že sú splnené niektoré ďalšie požiadavky (napr. Poskytnutie autoritatívneho vyjadrenia archivára), Patentový úrad USA a Európsky patentový úrad prijme dátumové pečiatky z internetového archívu ako dôkaz toho, kedy bola daná webová stránka prístupná verejnosti. Tieto dátumy sa používajú na určenie, či je webová stránka k dispozícii ako doterajší stav techniky napríklad pri skúmaní patentovej prihlášky.[69]

Obmedzenia užitočnosti

Archivácia webovej stránky má technické obmedzenia, a v dôsledku toho je možné, že protistrany v súdnom spore zneužijú výsledky poskytované archívmi webovej stránky. Tento problém sa môže zhoršiť praxou odosielania snímok obrazovky webových stránok do sťažností, odpovedí alebo správ znalcov, keď nie sú odhalené odkazy, ktoré obsahujú, a preto môžu obsahovať chyby. Napríklad archívy ako Wayback Machine nevyplňujú formuláre, a preto neobsahujú obsah iných akoRESTful databázy elektronického obchodu v ich archívoch.[70]

Právny stav

V Európe by sa dalo zariadenie Wayback Machine interpretovať ako porušujúce autorské práva zákony. Iba tvorca obsahu môže rozhodnúť, kde sa ich obsah zverejní alebo duplikuje, takže archív bude musieť na žiadosť tvorcu vymazať stránky zo svojho systému.[71] Pravidlá vylúčenia pre stroj Wayback Machine sa nachádzajú v sekcii Časté otázky na tomto serveri.[72]

Právne problémy s archivovaným obsahom

Proti internetovému archívu bolo vznesených niekoľko prípadov špeciálne pre účely archivácie v rámci Wayback Machine.

Scientológia

Koncom roku 2002 internetový archív odstránil rôzne stránky, ktoré boli kritické Scientológia zo stroja Wayback.[73] Chybové hlásenie uvádzalo, že sa jedná o reakciu na „žiadosť vlastníka stránky“.[74] Neskôr sa objasnilo, že právnici z Scientologická cirkev požadoval odstránenie a že majitelia stránok nechceli, aby bol ich materiál odstránený.[75]

Healthcare Advocates, Inc.

V roku 2003 spoločnosť Harding Earley Follmer & Frailey obhajovala klienta pred sporom o ochrannú známku pomocou archívneho stroja Wayback Machine. Advokáti boli schopní preukázať, že tvrdenia žalobcu sú neplatné, na základe obsahu ich webovej stránky spred niekoľkých rokov. Žalobca, Healthcare Advocates, potom zmenil a doplnil svoju sťažnosť tak, aby zahŕňala internetový archív, ktorý obviňuje organizáciu z porušenia autorských práv, ako aj z porušenia autorských práv. DMCA a Zákon o počítačových podvodoch a zneužívaní. Advokáti v zdravotníctve tvrdili, že keďže nainštalovali a robots.txt archív na ich webovej stránke, aj keď po podaní pôvodnej žaloby mal archív odstrániť všetky predchádzajúce kópie webovej stránky žalobcu zo stroja Wayback Machine, niektoré materiály však boli naďalej na serveri Wayback verejne viditeľné.[76] Súdny spor bol urovnaný mimosúdnou cestou potom, čo Wayback problém vyriešil.[77]

Suzanne Shell

Aktivista Suzanne Shell podala žalobu v decembri 2005 a požadovala od Internet Archive, aby jej zaplatil 100 000 USD za archiváciu jej webovej stránky profane-justice.org v rokoch 1999 až 2004.[78][79] Internetový archív podal a deklaratórny rozsudok akcia v Okresný súd Spojených štátov pre severný okres Kalifornie 20. januára 2006, ktorým sa domáhali súdneho určenia, že Internet Archive neporušil Shell autorské práva. Shell odpovedal a priniesol protisúda proti Internet Archive za archiváciu jej stránky, ktorá je podľa nej v rozpore s jej podmienky služby.[80] Dňa 13. Februára 2007 sudca pre Okresný súd Spojených štátov pre okres Colorado zamietol všetky protinávrhy okrem porušenie zmluvy.[79] Internetový archív sa neodvolal porušenie autorských práv tvrdí spoločnosť Shell, ktorá vyplýva z jej kopírovacích činností, ktoré by tiež pokračovali.[81]

25. apríla 2007 internetový archív a Suzanne Shell spoločne oznámili urovnanie ich sporu.[78] Internetový archív uviedol, že „... nemá žiadny záujem na pridávaní materiálov do zariadenia Wayback Machine osôb, ktoré si neželajú, aby sa ich webový obsah archivoval. Uvedomujeme si, že pani Shellová má na svoje webové stránky platné a vynútiteľné autorské práva, a je nám ľúto že začlenenie jej webovej stránky do stroja Wayback Machine viedlo k tomuto súdnemu sporu. ““ Shell uviedol: „Rešpektujem historickú hodnotu cieľa Internetového archívu. Nikdy som nemal v úmysle zasahovať do tohto cieľa ani mu spôsobiť nijakú škodu.“[82]

Daniel Davydiuk

V rokoch 2013 až 2016, a pornografický herec menom Daniel Davydiuk sa pokúsil odstrániť archivované jeho fotografie z archívu Wayback Machine, najskôr odoslaním viacerých Žiadosti podľa zákona DMCA do archívu a potom odvolaním na Federálny súd v Kanade.[83][84][85]

Cenzúra a ďalšie hrozby

Archive.org momentálne je blokovaný v Číne.[86][87] Po zakázaní teroristickej organizácie Islamský štát bol internetový archív zakázaný blokovaný v celom rozsahu v Rusku ako hostiteľ informačného videa od tejto organizácie, na krátku dobu v rokoch 2015–16.[51][88][89][potrebuje aktualizáciu] Od roku 2016 je webová stránka späť a je k dispozícii ako celok, hoci miestni komerční lobisti žalujú internetový archív na miestnom súde, aby ich zakázali z dôvodu ochrany autorských práv.[90]

Alison Macrina, riaditeľ projektu Knižnica Sloboda, poznamenáva, že „hoci si knihovníci veľmi vážia súkromie jednotlivcov, rovnako dôrazne vystupujeme proti cenzúre“.[51]

Sú známe zriedkavé prípady, keď webová stránka zakázala online prístup k obsahu, ktorý „pre nič“ vystavil ľudí nebezpečenstvu.[51]

Medzi ďalšie hrozby patria prírodné katastrofy,[91] zničenie (diaľkové alebo fyzické),[92] manipulácia s obsahom archívu (pozri tiež: kybernetický útok, záloha), problematické zákony o autorských právach[93] a dohľad nad používateľmi stránky.[94]

Kevin Vaughan má podozrenie, že z dlhodobého hľadiska niekoľko generácií „takmer nič“ užitočným spôsobom prežije a tvrdí: „Ak máme v našej technologickej civilizácii kontinuitu“, pomocou ktorej „zostane veľa holých údajov vyhľadateľných a prehľadateľných“ „.[95]

V článku uvažujúcom o zachovaní ľudských vedomostí Atlantik poznamenal, že internetový archív, ktorý sám o sebe opisuje, že bude vybudovaný z dlhodobého hľadiska,[96] „zúrivo pracuje na zachytávaní údajov skôr, ako zmiznú, a to bez akejkoľvek dlhodobej infraštruktúry.“[97]

Pozri tiež

Referencie

  1. ^ „WayBackMachine.org WHOIS, DNS a informácie o doméne - DomainTools“. KTO JE. Získané 13. marca 2016.
  2. ^ „InternetArchive.org WHOIS, DNS a informácie o doméne - DomainTools“. KTO JE. Získané 13. marca 2016.
  3. ^ Notess, Greg R. (marec - apríl 2002). „Stroj Wayback: Archív webu“. Online. 26: 59–61 - cez EBSCOhost.
  4. ^ „Stroj Wayback“, často kladené otázky, archivované z pôvodného 18. septembra 2018, načítané 18. september 2018
  5. ^ a b „20 000 pevných diskov na misii | Blogy internetového archívu“. blog.archive.org. 25. októbra 2016. Archivované z pôvodného 20. októbra 2018. Získané 15. október 2018.
  6. ^ Green, Heather (28. februára 2002). „Knižnica veľká ako svet“. BusinessWeek. Archivované od pôvodné dňa 20. decembra 2011.
  7. ^ Tong, Judy (8. septembra 2002). „Zodpovedná strana - Brewster Kahle; Knižnica webu na webe“. New York Times. Archivované z pôvodného dňa 20. februára 2011. Získané 15. augusta 2011.
  8. ^ „MTV Online: Hlavná stránka - Wayback Machine“. Wayback Machine. 12. mája 1996. Archivované od pôvodné 12. mája 1996. Získané 17. júla 2020.
  9. ^ „Sprievodca Infoseek - stroj Wayback“. Wayback Machine. 12. mája 1996. Archivované od pôvodné 12. mája 1996. Získané 16. decembra 2016.
  10. ^ a b „Internetový archív: Wayback Machine“. archive.org. Archivované z pôvodného 3. januára 2014. Získané 15. október 2018.
  11. ^ Cook, John (1. novembra 2001). „Webové stránky vás zavedú späť do histórie internetu“. Seattle Post-Intelligencer. Archivované z pôvodného dňa 12. augusta 2014. Získané 15. augusta 2011.
  12. ^ Mayfield, Kendra (28. októbra 2001). „Wayback Goes Way Back on Web“. Drôtové. Archivované z pôvodného dňa 16. októbra 2017. Získané 16. október 2017.
  13. ^ a b c Arora, Sanjay K .; Li, Yin; Youtie, Jan; Shapira, Philip (5. mája 2015). „Používanie stroja wayback na ťažbu webových stránok v spoločenských vedách: metodický zdroj“. Vestník Asociácie pre informačnú vedu a techniku. 67 (8): 1904–1915. doi:10.1002 / asi.23503. ISSN 2330-1635.
  14. ^ a b c d e f g h Kalev Leetaru (28. januára 2016). „Internetový archív sa dožíva 20 rokov: Zákulisie pohľadu na archiváciu webu“. Forbes. Archivované z pôvodného dňa 16. októbra 2017. Získané 16. október 2017.
  15. ^ http://blog.archive.org/2020/10/30/fact-checks-and-context-for-wayback-machine-pages/
  16. ^ Kahle, Brewster. „Archivácia internetu“. Scientific American - vydanie z marca 1997. Archivované z pôvodného dňa 3. apríla 2012. Získané 19. augusta 2011.
  17. ^ Jeff Kaplan (27. októbra 2014). „Archive-It: Spoločné prehľadávanie webu“. Blogy internetového archívu. Archivované z pôvodného dňa 12. októbra 2017. Získané 16. október 2017.
  18. ^ a b „Celosvetové prehľadávanie webu“. Internetový archív. Archivované z pôvodného 19. októbra 2017. Získané 16. október 2017.
  19. ^ „Široké indexové prehľadávanie číslo 13“. Internetový archív. Archivované z pôvodného 19. októbra 2017. Získané 16. október 2017.
  20. ^ „Internetový archív: Petabox“. archive.org. Získané 25. október 2018.
  21. ^ Kanellos, Michael (29. júla 2005). „Lacné veľké úložisko“. CNET News.com. Archivované od pôvodné 3. apríla 2007. Získané 29. júla 2007.
  22. ^ „Internetový archív a Sun Microsystems vytvárajú živú históriu internetu“. Sun Microsystems. 25. marca 2009. Archivované z pôvodného dňa 26. marca 2009. Získané 27.03. 2009.
  23. ^ Mearian, Lucas (19. marca 2009). „Internetový archív odhalí masívne dátové centrum stroja Wayback Machine“. Computerworld.com. Archivované od pôvodné dňa 23. marca 2009. Získané 22.03. 2009.
  24. ^ „Aktualizovaný stroj Wayback v beta testovaní“. Archivované od pôvodné dňa 23. augusta 2011. Získané 19. augusta 2011.
  25. ^ „Beta Wayback Machine, vo fóre“. Archivované z pôvodného dňa 17. apríla 2014. Získané 16. apríla 2014.
  26. ^ „Fóra internetového archívu: 6. pár regálov je uvedený do prevádzky: využíva sa viac ako 2 PB dátového priestoru“. archive.org. Archivované z pôvodného dňa 24. októbra 2016. Získané 25. október 2018.
  27. ^ „Stroj Wayback: Teraz s 240 000 000 000 adresami URL | Blogy internetového archívu“. 9. januára 2013. Archivované z pôvodného dňa 14. apríla 2014. Získané 16. apríla 2014.
  28. ^ Rossi, Alexis (25. októbra 2013). „Oprava nefunkčných odkazov na internete“. archive.org. San Francisco, CA, USA: Kolektívny tím, internetový archív. Archivované z pôvodného 7. novembra 2014. Získané 25. marec 2015. Pridali sme možnosť okamžite archivovať stránku a získať späť trvalú adresu URL tejto stránky v stroji Wayback. Táto služba umožňuje komukoľvek - redaktorom wikipedie, učencom, právnikom, študentom alebo domácim kuchárom ako som ja - vytvoriť stabilnú adresu URL, na ktorú bude citovať, zdieľať alebo ukladať akékoľvek informácie, ku ktorým chce mať v budúcnosti prístup.
  29. ^ „Nový internetový archív Wayback Machine je teraz online“. www.digitaljournal.com. 23. októbra 2013.
  30. ^ Tím VirusTotal (25. marca 2015). „207.241.226.190 informácie o adrese IP“. virustotal.com. Dublin 2, Írsko: VirusTotal. Archivované z pôvodného dňa 14. júla 2014. Získané 25. marec 2015. 2015-03-25: Najnovšie adresy URL hostené na tejto adrese IP detekované najmenej jedným skenerom adries URL alebo škodlivým súborom údajov URL. ... 2/62 2015-03-25 16:14:12 [kompletná adresa URL redigovaná] /Renegotiating_TLS.pdf ... 1/62 2015-03-25 04:46:34 [kompletná adresa URL redigovaná] /CBLightSetup.exeCS1 maint: umiestnenie (odkaz)
  31. ^ Poradenstvo poskytnuté spoločnosťou Google (25. marca 2015). „Diagnostická stránka bezpečného prehliadania pre stránku archive.org“. google.com/safebrowsing. Mountain View, CA, USA. Archivované od originálu 6. apríla 2015. Získané 25. marec 2015. 2015-03-25: Za posledných 90 dní bola časť tohto webu uvedená v zozname pre podozrivú aktivitu 138-krát. ... Čo sa stalo, keď spoločnosť Google navštívila túto stránku? ... Z celkového počtu 42 410 stránok, ktoré sme na webe testovali za posledných 90 dní, malo 450 stránok za následok stiahnutie a inštaláciu škodlivého softvéru bez súhlasu používateľa. Spoločnosť Google túto stránku poslednýkrát navštívila 25. 3. 2015 a podozrivý obsah sa na nej našiel naposledy dňa 2015-03-25. ... Medzi škodlivý softvér patrí 169 trójskych koní, 126 vírusov, 43 zadných vrátok.
  32. ^ „Internetový archív - často kladené otázky“. Archivované z pôvodného dňa 21. októbra 2009. Získané 17. januára 2015.
  33. ^ „Internetový archív - často kladené otázky“. 18. decembra 2014. Archivované od pôvodné dňa 18. decembra 2014. Získané 13. decembra 2018.
  34. ^ „Môže manipulácia s veľkými dátami zmeniť spôsob myslenia sveta?“. Národný. Archivované z pôvodného dňa 12. januára 2017. Získané 14. mája 2017.
  35. ^ Crockett, Zachary (28. septembra 2018). „Inside Wayback Machine, časová kapsula internetu“. Hustle. Archivované z pôvodného 2. októbra 2018. Získané 26. október 2018.
  36. ^ Heffernan, Virgínia (18. septembra 2018). „Veci sa lámu a rozkladajú na internete - to je dobrá vec“. WIRED. Archivované z pôvodného dňa 25. septembra 2018. Získané 26. október 2018.
  37. ^ michelle (9. mája 2014). „Wayback Machine Hits 400,000,000,000!“. Internetový archív. Archivované z pôvodného dňa 26. augusta 2014. Získané 25. marec 2015.
  38. ^ „Internetový archív Wayback Machine“. Internetový archív. Archivované od pôvodné dňa 13. februára 2015. Získané 25. marec 2015.
  39. ^ „Niektoré stránky nie sú k dispozícii z dôvodu súboru Robots.txt alebo iných vylúčení.“. Archivované od pôvodné dňa 15. apríla 2011.
  40. ^ „Internetový archív - často kladené otázky“. Archivované od pôvodné dňa 17. apríla 2014.
  41. ^ Cox, Joseph (22. mája 2018). „Stroj Wayback odstraňuje dôkazy o malvéri predanom spoločnosti Stalkers“. Archivované z pôvodného 23. mája 2018. Získané 23. mája 2018.
  42. ^ „Robots.txt určený pre vyhľadávače nefunguje dobre pre webové archívy“. Internetový archív. 17. apríla 2017. Získané 29. júna 2019.
  43. ^ https://help.archive.org/hc/en-us/articles/360004651732-Using-The-Wayback-Machine
  44. ^ „Odporúčania pre správu požiadaviek na odstránenie a zachovanie integrity archívu“. Kalifornská univerzita. 14. decembra 2002. Archivované z pôvodného 18. septembra 2017. Získané 14. september 2017.
  45. ^ „Retroaktívne odstránenie súboru robots.txt z minulých indexových prehľadávaní AKA Oakland Archive Policy“. Internetový archív. 7. júla 2014. Archivované z pôvodného dňa 10. októbra 2017. Získané 14. september 2017.
  46. ^ Mark Graham (17. apríla 2017). „Robots.txt určený pre vyhľadávače nefunguje dobre pre webové archívy“. Blogy internetového archívu. Archivované z pôvodného dňa 17. apríla 2017. Získané 16. apríla 2017.
  47. ^ „Archivierung des Internets: Internet Archive ignoriert künftig robots.txt“ (V Nemecku). heise online. Archivované z pôvodného dňa 27. apríla 2017. Získané 14. mája 2017.
  48. ^ „Suchmaschinen: Internet Archive will künftig Robots.txt-Einträge ignorieren - Golem.de“ (V Nemecku). Archivované z pôvodného 19. júna 2017. Získané 14. mája 2017.
  49. ^ „Internetový archív bude súbory robots.txt ignorovať, aby boli historické záznamy presné“. Digitálne trendy. 24. apríla 2017. Archivované od originálu 16. mája 2017. Získané 14. mája 2017.
  50. ^ Sampath Kumar, B.T .; Prithviraj, K.R. (21. októbra 2014). "Oživenie: Úloha stroja Wayback pri načítaní zmiznutých adries URL". Journal of Information Science. 41 (1): 71–81. doi:10.1177/0165551514552752. ISSN 0165-5515. S2CID 28320982.
  51. ^ a b c d e „Stroj Wayback nebude cenzurovať archív pre vkus, riaditeľ hovorí po olympijských hrách článok vydrhnutý“. Archivované od pôvodného 6. januára 2017. Získané 14. mája 2017.
  52. ^ Lepore, Jill (26. januára 2015). „Čo povedal web včera“. Newyorčan. Archivované z pôvodného dňa 25. januára 2015. Získané 14. mája 2017.
  53. ^ „Pochod za vedu sa začal„ vyhadzovacou linkou “tejto osoby na Reddite“. Washington Post. Archivované z pôvodného 23. apríla 2017. Získané 23. apríla 2017.
  54. ^ „Idú vedci pochodovať do Washingtonu?“. The Washington Post. Archivované od pôvodného 31. januára 2017. Získané 31. január 2017.
  55. ^ Foley, Katherine Ellen. „Celosvetový pochod za vedu sa začal jediným vláknom Reddit“. Kremeň. Archivované od pôvodného 24. apríla 2017. Získané 23. apríla 2017.
  56. ^ http://blog.archive.org/2018/10/01/more-than-9-million-broken-links-on-wikipedia-are-now-rescued
  57. ^ Graham, Mark (17. septembra 2020). „Cloudflare a Wayback Machine, spojenie síl pre spoľahlivejší web“. Blogy internetového archívu. Získané 17. september 2020.
  58. ^ „Internetový archív - často kladené otázky“. Internetový archív. 2. apríla 2014. Archivované od pôvodné dňa 2. apríla 2014. Získané 23. novembra 2018.
  59. ^ „Internetový archív - často kladené otázky“. archive.org. Získané 23. novembra 2018.
  60. ^ a b Bates, Mary Ellen (2002). „Stroj Wayback“. Online. 26: 80 - cez EBSCOhost.
  61. ^ „YouTube - Archiveteam“. archiveteam.org. Získané 6. augusta 2020.
  62. ^ „Internetový archív - často kladené otázky“. archive.org. Archivované z pôvodného dňa 20. apríla 2013. Získané 18. október 2018.
  63. ^ a b c Lloyd, Howard (október 2009). „Order to Disable Robots.txt“ (PDF). Archivované od pôvodné (PDF) 8. augusta 2019. Získané 15. október 2009.
  64. ^ Cortes, Antonio (október 2009). „Odstránenie súboru Robots.txt namietajúce proti pohybu“. Archivované od pôvodné 27. októbra 2010. Získané 15. október 2009.
  65. ^ Gelman, Lauren (17. novembra 2004). „Snímky webových stránok Internetového archívu sú prípustné ako dôkaz“. Pakety. 2 (3). Archivované od pôvodné dňa 30. apríla 2011. Získané 4. januára 2007.
  66. ^ Howell, Beryl A. (február 2006). „Proving Web History: How to use the Internet Archive“ (PDF). Vestník internetového práva: 3–9. Archivované od pôvodné (PDF) 5. júla 2010. Získané 6. augusta 2008.
  67. ^ „Hľadanie dôkazov na virtuálnych miestach Prípustnosť dôkazov o internete“. Archivované od pôvodného 1. júla 2019. Získané 14. júna 2020.
  68. ^ Levitt, Carole A .; Rosch, Mark E. (2010). Nájdite informácie ako profesionál: Ťažba verejne dostupných zdrojov na internete pre vyšetrovací výskum, Tom 1. Americká advokátska komora. s. 194–196. ISBN 978-1-60442-890-2. Získané 14. júna 2020.
  69. ^ Wynn W. Coggins (jeseň 2002). „Doterajší stav techniky v oblasti patentov obchodných metód - Kedy je elektronický dokument tlačenou publikáciou na účely doterajšieho stavu techniky?“. USPTO. Archivované od pôvodné dňa 21. septembra 2012. Získané 15. augusta 2012.
  70. ^ „Odhalenie stroja Wayback“. Archivované od pôvodné dňa 29. júna 2010.
  71. ^ Bahr, Martin (2002). „The Wayback Machine und Google Cache - eine Verletzung deutschen Urheberrechts?“. JurPC (v nemčine): 9. doi:10,7328 / jurpcb / 20021719. Archivované z pôvodného 23. augusta 2009.
  72. ^ „Internetový archív - najčastejšie otázky“. Archivované z pôvodného dňa 17. apríla 2014. Získané 16. apríla 2014.
  73. ^ Bowman, Lisa M (24. septembra 2002). „Čistý archív umlčuje scientologického kritika“. CNET News.com. Archivované od pôvodné dňa 15. mája 2012. Získané 4. januára 2007.
  74. ^ Jeff (23. septembra 2002). „vylúčenia zo stroja Wayback Machine“ (Blog). Fórum strojov Wayback. Internetový archív. Archivované z pôvodného dňa 11. februára 2007. Získané 4. januára 2007. Autor a dátum označujú začatie vlákna vlákna.
  75. ^ Miller, Ernest. „Sherman, nastavte Wayback Machine na scientológiu“. LawMeme. Yale Law School. Archivované od pôvodné (Blog) dňa 16. novembra 2012. Získané 4. januára 2007.
  76. ^ Dye, Jessica (2005). „Webové stránky žalované za kontroverzný výlet do minulosti internetu“. EContent. 28. 11: 8–9.
  77. ^ Bangeman, Eric (31. augusta 2006). „Internetový archív sa vyrovnáva so strojom Wayback“. Ars Technica. Archivované z pôvodného dňa 5. novembra 2007. Získané 29. novembra 2007.
  78. ^ a b Internetový archív v. Shell, 505 F. Supp. 2d 755 na justia.com, 1: 2006cv01726 (Okresný súd v Colorade 31. augusta 2006) („„ 25. apríla 2007 bola oznámená dohoda o urovnaní. “Podanie 65, 2007-04-30:„ ... preto OBJEDNÁVA, že táto záležitosť bude PRIJATÁ S PREDSUDKOM ... “).
  79. ^ a b Babcock, Lewis T., hlavný sudca (13. februára 2007). "Internetový archív v. Shell Občianska žaloba č. 06cv01726LTBCBS “ (PDF). Archivované (PDF) z pôvodného dňa 25. januára 2014. Získané 25. marec 2015. 1) JE UDELENÝ návrh Internetového archívu na zamietnutie vzájomnej žaloby spoločnosti Shell na premenu a občiansku krádež (druhá príčina žaloby), 2) Návrh internetového archívu na zamietnutie vzájomnej žaloby spoločnosti Shell pre porušenie zmluvy (tretia príčina žaloby) je ZAMIETNUTÁ; 3) Je povolený návrh Internetového archívu na zamietnutie vzájomnej žaloby spoločnosti Shell za vydieranie podľa RICO a COCCA (štvrtá príčina konania).
  80. ^ Claburn, Thomas (16. marca 2007). „Žena z Colorada žiada, aby boli kontrakty uzatvorené s webovými prehľadávačmi“. New York, NY, USA: InformationWeek, UBM Tech, UBM LLC. Archivované z pôvodného 4. septembra 2014. Získané 25. marec 2015. Počítače môžu uzatvárať zmluvy v mene ľudí. The Uniform Electronic Transactions Act (UETA) says that a 'contract may be formed by the interaction of electronic agents of the parties, even if no individual was aware of or reviewed the electronic agents' actions or the resulting terms and agreements.'
  81. ^ Samson, Martin H., Phillips Nizer LLP (2007). "Internet Archive v. Suzanne Shell". internetlibrary.com. Internet Library of Law and Court Decisions. Archivované z pôvodného 3. augusta 2014. Získané 25. marec 2015. More importantly, held the court, Internet Archive's mere copying of Shell's site, and display thereof in its database, did not constitute the requisite exercise of dominion and control over defendant's property. Importantly, noted the court, the defendant at all times owned and operated her own site. Said the Court: 'Shell has failed to allege facts showing that Internet Archive exercised dominion or control over her website, since Shell's complaint states explicitly that she continued to own and operate the website while it was archived on the Wayback machine. Shell identifies no authority supporting the notion that copying documents is by itself enough of a deprivation of use to support conversion. Conversely, numerous circuits have determined that it is not.'
  82. ^ brewster (April 25, 2007). "Internet Archive and Suzanne Shell Settle Lawsuit". archive.org. Denver, CO, USA: Internet Archive. Archivované from the original on December 5, 2010. Získané 25. marec 2015. Both parties sincerely regret any turmoil that the lawsuit may have caused for the other. Neither Internet Archive nor Ms Shell condones any conduct which may have caused harm to either party arising out of the public attention to this lawsuit. The parties have not engaged in such conduct and request that the public response to the amicable resolution of this litigation be consistent with their wishes that no further harm or turmoil be caused to either party.
  83. ^ Stobbe, Richard (December 5, 2014). "Copyright Implications Of A "Right To Be Forgotten"? Or How To Take-Down The Internet Archive". Mondaq. Získané 8. marca 2019.
  84. ^ McVeigh, Glennys (October 16, 2014). Philpott, James; Weissman, Adam; Bucholz, Ren; Kettles, Brent; Pearl, Aaron (eds.). "Davydiuk v. Internet Archive Canada, 2014 FC 944". CanLII. Federation of Law Societies of Canada. Získané 8. marca 2019.
  85. ^ Southcott, Richard F. (November 30, 2016). Philpott, John; Alton, Alex; Bucholz, Ren (eds.). "Davydiuk v. Internet Archive Canada and Internet Archive, 2016 FC 1313 (CanLII)". CanLII. Ottawa, Ontario: Federation of Law Societies of Canada. Získané 8. marca 2019.
  86. ^ Conger, Kate. "Backing up the history of the internet in Canada to save it from Trump". TechCrunch. Archivované from the original on December 27, 2016. Získané 14. mája 2017.
  87. ^ "Where to find what's disappeared online, and a whole lot more: the Internet Archive". Public Radio International. Archivované from the original on March 28, 2017. Získané 14. mája 2017.
  88. ^ Chirgwin, Richard. "There's no Wayback in Russia: Putin blocks Archive.org". Archivované from the original on October 7, 2016. Získané 14. mája 2017.
  89. ^ "Russia won't go Wayback, blocks the Internet Archive". Digital Trends. June 26, 2015. Archivované from the original on April 17, 2016. Získané 14. mája 2017.
  90. ^ "В России разблокирован крупнейший интернет-архив". Российская газета (v ruštine). Získané 18. október 2020.
  91. ^ "Help Us Keep the Archive Free, Accessible, and Reader Private | Internet Archive Blogs". November 29, 2016. Archivované from the original on May 21, 2017. Získané 14. mája 2017.
  92. ^ https://www.engadget.com/2013-11-07-wayback-machine-internet-archive-fire.html
  93. ^ "Internet Archive: Proposed Changes To DMCA Would Make Us "Censor The Web"". Consumerist. June 7, 2016. Archivované from the original on November 11, 2016. Získané 14. mája 2017.
  94. ^ Herb, Ulrich. "Die Trump-Angst grassiert" (V Nemecku). heise online. Archivované from the original on December 7, 2016. Získané 14. mája 2017.
  95. ^ LaFrance, Adrienne. "The Internet's Dark Ages". Atlantik. Archivované from the original on May 7, 2017. Získané 14. mája 2017.
  96. ^ "The Entire Internet Will Be Archived In Canada to Protect It From Trump". Motherboard. November 29, 2016. Archivované from the original on May 16, 2017. Získané 14. mája 2017.
  97. ^ LaFrance, Adrienne (June 3, 2016). "The Human Fear of Total Knowledge". Atlantik. Archivované z pôvodného 2. decembra 2016. Získané 14. mája 2017.

vonkajšie odkazy

Pin
Send
Share
Send