• 40. Kolekcja Brexitowa w UK Web Archiwum UK Web Archiwe udostępniło kolekcje archiwalne dokumentujące proces brexitowy. Obok kopii stron WWW znajdują się w nim materiały z mediów społecznościowych. Ze względów prawnoautorskich część zasobów można przeglądać wyłącznie w wybranych czytelniach. www.webarchive.org.uk | #webarchiving | 2020-02-03
  • 69. Wsparcie przy przeglądaniu usuniętych zasobów WWW Przeglądarka Brave od wersji 1.4 została wyposażona w system wychwytujący wybrane błędy HTTP (związane z niedostępnością żądanej strony) i proponujący użytkownikowi/użytkowniczce kopie z Wayback Machine. blog.archive.org | #webarchiving | 2020-03-02
  • 78. Archiwizacja filmików z Vine Serwis Vine.co zamknął możliwość dodawania nowych materiałów 20 stycznia 2017 i był stopniowo wygaszany do pełnienia roli archiwum (obecnie aby dostać się do filmiku trzeba znać jego URL). Zanim jednak ogłoszono plany zachowania go w tej formie grupa ArchiveTeam postanowiła podjąć próbę jego archiwizacji. W celu dokonania selekcji zasobów do zachowania kierowano się ich popularnością, jednakże nie wykorzystano ilości odtworzeń lub innych statystyk wewnętrznych, a linki do Vine'a zamieszczane w tweetach. Autorzy artykułu omawiają ten model działania (zwracając uwagę na to, że z jednej strony pozwala on ocenić popularność filmików, a z drugiej pomija inne media społecznościowe, na których udostępniano linki do Vine'a, np. Facebooka). culturalanalytics.org | #webarchiving | 2020-03-10
  • 86. Archiwizacja Webu w Bibliotece Kongresu Program archiwizacji Webu prowadzony przez Bibliotekę Kongresu kończy w tym roku 20 lat - do tej pory zgromadzono 2 petabajty zasobów. blogs.loc.gov | #webarchiving | 2020-04-03
  • 93. Biblioteka Kongresu archiwizuje memy Przez ostatnie dwie dekady mały zespół archiwistów codziennie zajmuje się archiwizowaniem gifów, tweetów, wpisów na blogach, memów oraz wszelkich zdjęć, które z różnych przyczyn stały się “wirusowe”. Według dziennika “New York Times” biblioteka zgromadziła już ponad 2,129 petabajtów danych, co przekłada się na 18 miliardów dokumentów cyfrowych. mediaphilia.pl | #webarchiving | 2020-04-10
  • 94. Archiwizacja zasobów webowych dotyczących pandemii COVID-19 IIPC, międzynarodowe konsorcjum zrzeszające instytucje archiwizujące zasoby WWW, koordynuje budowę archiwum webowego COVID-19. Zebrano do tej pory 4.5 tys. stron, głównie w języku angielskim i z domeny *.com. archive-it.org | #webarchiving | 2020-04-20
  • 100. Archiwa Webu w badaniach historycznych Web Archives for Historical Research to grupa badawcza działająca na Uniwersytecie Waterloo w Kanadzie pod przewodnictwem Iana Milligana. Działa ona od 2015 roku i do jej głównych celów należy popularyzacja i rozwój badań historycznych nad dawnym Webem. Członkowie zespołu zaangażowani są w różne działania związane z archiwizacją WWW w Kanadzie i na świecie, jednak ich najważniejszym obecnie projektem jest Archives Unleashed, który ma na celu przygotowanie narzędzi umożliwiających wszechstronne badanie archiwów Sieci. uwaterloo.ca | #webarchiving | 2020-04-26
  • 104. Pandemia COVID-19 i "kontent zombie" Fałszywe informacje i mistyfikacje związane z pandemią koronawirusa przysparzają bardzo dużo problemów. Administratorzy mediów społecznościowych ograniczają zasięgi fake newsów, jednak badacze z harwardzkiego Centrum Shoresteina zauważyli lukę w ich działaniach. Aby oszukać algorytmy, zamiast oryginalnych URLi witryn, wykorzystuje się linki prowadzące do ich odpowiedników zarchiwizowanych w Internet Archive. Jak pokazują statystyki zasięgów taki zabieg pozwala omijać zabezpieczenia i skutecznie rozpowszechniać dezinformację. Zdaniem autora artykułu Internet Archive będzie musiało w przyszłości znaleźć rozwiązanie problemu niewłaściwego korzystania z Wayback Machne, zwłaszcza że nie jest to pierwszy taki przypadek www.technologyreview.com | #webarchiving | 2020-05-02
  • 120. Archiwizacja Webu w Europie – narodowe archiwa Sieci Artykuł Bartłomieja Konopy opublikowany w najnowszym tomie czasopisma "Archeion". Artykuł analizuje wybrane europejskie archiwa Webu, przedstawiając schematy wyboru, gromadzenia i prezentacji zbiorów. www.ejournals.eu | #webarchiving | 2021-01-03
  • 123. Pandemiczna kolekcja zbiorów webowych w BnF Biblioteka Narodowa Francji archiwizuje zasoby Webu związane z pandemią COVID-19. Materiał opublikowany w cyklu WARCnet Papers pozwala zapoznać się z metodami selekcji i gromadzenia tych zbiorów. cc.au.dk | #webarchiving | 2021-01-04
  • 126. ArchiveBox - osobiste archiwum Webu ArchiveBox to napisane w Pythonie oprogramowanie umożliwiające uruchomienie własnego, osobistego archiwum Webu. Program dostępny jest do samodzielnej instalacji (obsługuje wszystkie platformy dzięki wykorzystaniu Dockera) lub jako aplikacja desktopowa. archivebox.io | #webarchiving | 2021-01-07
  • 129. SHARI - metodologia budowania historii ze źródeł internetowych Pomysł autorów linkowanego artykułu to integracja kilku narzędzi (StoryGraph, Hypercane, ArchiveNow i Raintale) w celu generowania wizualizacji łączących ze sobą poszczególne newsy na wybrany temat - tutaj przykład. Istotnym elementem SHARI jest integracja z zasobami archiwów Webu. arxiv.org | #webarchiving | 2021-01-09
  • 131. Archiwum tweetów Trumpa Zablokowanie twitterowego konta ustępującego prezydenta USA spowodowało, że jego wpisy nie są dostępne. Trump Twitter Archive (TTA) umożliwia dostęp do archiwalnych tweetów i ich przeszukiwanie. Możliwe jest także wyszukiwanie tweetów skasowanych. Efekty kwerend wyeksportować można do pliku CSV. www.thetrumparchive.com | #webarchiving | 2021-01-09
  • 138. Obywatelskie archiwizacje zamieszek na Kapitolu Przekazy na żywo na YouTube, Twitter, Facebook, komentarze blogowe - "insurekcja" zwolenników Trumpa na Kapitolu była intensywnie transmitowana i komentowana. Ponieważ duże platformy usuwały część zasobów, użytkownicy Reddita postanowili je zarchiwizować, niekiedy w celu późniejszej identyfikacji uczestników zajść. Zebrane materiały mają zostać przekazane do Biblioteki Kongresu. www.technologyreview.com | #webarchiving | 2021-01-13
  • 165. Czy współczesna pornografia powinna być archiwizowana? Autorka komentarza przypomina o wydarzeniach z grudnia 2020 roku, kiedy z serwisu Pornhub usunięto wszystkie filmy opublikowane przez niezweryfikowanych użytkowników. Były to m.in. treści zawierające pornongrafię dziecięcą, sceny gwałtu czy filmy revenge porn. Usunięto przy tym także treści publikowane przez osoby produkujące filmy niezależnie, poza strukturami przemysłu pornograficznego. Autorka zastanawia się, czy wyczyszczenie PornHub oznacza jakąkolwiek stratę dla badań nad pornografią i filmem i przywołuje kontekst debat nad wartością kulturową pornografii tworzonej w latach 60. oraz przypomina, że także Facebook jest medium dystrybucji treści zawierających akty przemocy seksualnej (także wobec dzieci). hyperallergic.com | #webarchiving | 2021-01-28
  • 171. Strategie archiwalne dla zbiorów webowych: przypadek UK Web Archive Artykuł opisuje strategie gromadzenia i archiwizacji zbiorów w ramach UK Web Archive, konsorcjum kilku brytyjskich instytucji pamięci, które od 2013 roku regularnie archiwizuje zbiory domeny .uk oraz posiada specjalne kolekcje zasobów cyfrowych, tworzone od 2005 roku. Artykuł próbuje opisać jaki model dziedzictwa przyjęto w działaniach UK Web Archive oraz jakie etyczne wyzwania pojawiają się przy gromadzeniu zbiorów archiwalnych z Webu. doi.org | #webarchiving | 2021-02-01
  • 183. Archiwizacja Webu to tylko przybliżanie przeszłych zasobów Granica między materiałem wartym zarchiwizowania a papką zalewającą kanały komunikacji w Internecie, staje się coraz cieńsza - czytamy w eseju o archiwizacji Webu, opublikowanym w Lapham’s Quarterly. Reakcją na postępującą erozję starych zasobów WWW może być nie tylko poczucie rozgoryczenia z powodu braku dostępu i kontroli, ale też akceptacja, jakby tymczasowość miała być 'naturalną' cechą zasobów cyfrowych. Czy można to jakoś rozwiązać? Archiwizacja Webu jest zawsze tylko przybliżaniem tego, co kiedyś było dostępne. www.laphamsquarterly.org | #webarchiving | 2021-02-12
  • 191. Pierwsza analiza dostępności historycznych zasobów polskiego Webu Współcześnie dostępnych jest niecałe 22 proc. badanych adresów URL z wydanego w 1997 roku drukowanego katalogu stron WWW "Polish World". Równocześnie prawie 80 proc. adresów jest dostępnych w archiwach Webu - nie oznacza jednak, że została zachowana ich oryginalna postać. dx.doi.org | #webarchiving | 2021-02-22
  • 193. Europejskie Archiwum Webu? Archive.eu gromadzi kopie stron WWW z domen krajowych państw europejskich. Wbrew pozorom, nie jest prowadzone przez jakąkolwiek instytucję Unii Europejskiej ani przez nią finansowane. Kopie stron pozbawiane są kodów JavaScript oraz zasobów wczytywanych ze źródeł zewnętrznych - mocno wpływa to na jakość zachowanych zbiorów. Na stronie nie znajdziemy żadnych informacji o tym, kto je tworzy i na jakich zasadach gromadzi i udostępnia zasoby. Domena archive.eu została zarejestrowana przez czeskie przedsiębiorstwo Kleissner Investments, a projekt prowadzony jest w ramach marki Intelligence X - usługi indeksowania i przeszukiwania zasobów Webu. Archiwum - a raczej projekt archiwalny - indeksuje też polskie zasoby - około 2 mln domen. archive.eu | #webarchiving | 2021-02-23
  • 215. O strategiach pozyskiwania zbiorów w Internet Archive Z Internet Archive korzysta codziennie 1 mln użytkowników. Artykuł w magazynie "Protocol" opisuje m.in. strategie archiwizowania Webu w Internet Archive. Okazuje się, że IA archiwizuje filmy z YouTube opierając się na linkach udostępnianych na Twitterze, korzysta także z agregatorów newsów popularnych dla konkretnych domen. W tekście znajdziemy także ciekawy wątek na temat przeciwdziałaniu bałkanizacji Internetu oraz walce o kontrolę nad historycznymi wersjami zasobów WWW. www.protocol.com | #webarchiving | 2021-03-10
  • 226. Z innej planety: w archiwach Webu (audycja) Nagranie audycji z Radia Dla Ciebie (20 kwietnia) dotyczącej dziedzictwa cyfrowego i archiwizacji Webu. www.rdc.pl | #webarchiving | 2021-04-28