• 208. Ogłoszenie o pracę: specjalist(k)a ds. humanistyki cyfrowej (DARIAH) Instytut Badań Literackich PAN poszukuje specjalisty/ki ds. humanistyki cyfrowej – praca na pełny etat do 31.12.2023 r., w ramach projektu „Cyfrowa Infrastruktura Badawcza dla Humanistyki i Nauk o Sztuce DARIAH-PL”. Stanowisko obejmuje prace merytoryczne wspierające rozwój oprogramowania, narzędzi i serwisów cyfrowych, a także współtworzenie analiz, opracowań i innych dokumentów związanych z przedmiotem projektu (analizy potrzeb, raporty, sprawozdania). ibl.waw.pl | #dh | 2021-03-05
  • 207. Opisy zbiorów archiwalnych: podejście krytyczne Autorki artykułu "A Weapon and a Tool. Decolonizing Description and Embracing Redescription as Liberatory Archival Praxis" (2021) wskazują, że "bezkrytyczny" transfer z formatów analogowych do cyfrowych może powodować powielanie uprzedzeń i stereotypów ujawniających się w historycznych opisach zbiorów. doi.org | #archiwa | 2021-03-05
  • 206. Na Wydziale Filologicznym UŁ powołano Centrum Badań Posthumanistycznych Centrum Badań Posthumanistycznych ma charakter naukowy i zajmuje się badaniami z pogranicza nauk humanistycznych, środowiska naturalnego oraz nowych technologii. W ramach swoich działań Centrum będzie organizowało konferencje, wydawało publikacje, realizowało projekty badawcze, organizowało seminaria i wykłady gościnne. Docelowo naukowcy zaangażowani w działalność nowego podmiotu chcą stworzyć nowe czasopismo naukowe. www.uni.lodz.pl | #nauka | 2021-03-05
  • 205. PTA: cyfrowe wydania tekstów patrystycznych Partistic Text Archive (PTA) to uruchomione niedawno archiwum/repozytorium transkrybowanych tekstów patrystycznych. Obecnie dostępne są tam pisma 10 autorów (m.in. Euzebiusza z Cezarei czy Orygenesa) - łącznie 521 tekstów. Dominują teksty w języku greckim, jest też kilka tłumaczeń na język niemiecki. Wydania cyfrowe przygotowywane są zgodnie ze standardem TEI (wersja P5), korzystać z nich można na warunkach wolnych licencji. Serwis oferuje także podstawowe narzędzia do analizy tekstu oraz zaawansowane wyszukiwanie. PTA prowadzone jest przez Berlin-Brandenburgischen Akademie der Wissenschaften. pta.bbaw.de | #archiwa | 2021-03-04
  • 204. Jak archiwizować zasoby z Google Drive? Google Workspace Environments (wcześniej GSiute) pozwala na zakładanie instytucjonalnej infrastruktury tworzenia i wymiany dokumentów oraz przechowywania plików. Paul Young z brytyjskich Archiwów Narodowych opisuje wyzwania związane z zabezpieczaniem zasobów z tego środowiska: jedynym z podstawowych wyzwań jest to, że pracować musimy nie z osobnymi plikami, ale raczej danymi renderowanymi w przeglądarce. www.dpconline.org | #archiwa | 2021-03-04
  • 203. Kod/przestrzeń: oprogramowanie i życie codzienne [PDF] Wydawnictwo MIT Press uwolniło w otwartym dostępie tom artykułów pod red. Code/Space: Software and Everyday Life (2011). Publikacja zawiera artykuły "analizujące sposoby, w jakie oprogramowanie tworzy nowe przestrzenie w życiu codziennym: od linii kas w supermarketach po trasy linii lotniczych". direct.mit.edu | #oprogramowanie | 2021-03-04
  • 202. Przez Google i Facebooka rosną koszty korzystania z internetu To przejmowanie przez Google i Facebooka wpływów z reklamy w internecie wymusiło na wydawcach decyzje o zamykaniu darmowego dostępu do treści. Korzystanie z internetu staje się przez to coraz bardziej kosztowne. "we should recognize the trade we’ve made from ad-subsidized media to ad-subsidized search and social networking". www.bloomberg.com | #internet | 2021-03-04
  • 201. Wikipedia @20 : historie niedokończonej rewolucji "Wikipedia @20: Stories of an Incomplete Revolution" to publikacja zbiorowa wydana przez wydana przez MIT Press z okazji przypadającego w tym roku dwudziestolecia Wikipedii. W tomie znajdziemy m.in. opracowanie o recepcji Wikipedii w prasie, artykuły o relacjach między światem akademickim a Wikipedią czy potencjale tego projektu w całościowym, holistycznym opisywaniu wydarzeń i postaci historycznych. Przeczytać tam można także teksty poświęcone stereotypom i uprzedzieniom, ujawniającym się w treści haseł czy podejmujące problem dostępności treści Wikipedii poza infrastrukturą internetową. Książka opublikowana została w otwartym dostępie. mitpress.mit.edu | #wikipedia | 2021-03-02
  • 200. Typy uprzedzeń w danych Żadne dane nie są neutralne, te generowane z zasobów społecznych (np. z Internetu czy literatury) mogą dodatkowo replikować ujawniające się w tych źródłach stereotypy i uprzedzenia. "A Survey on Bias and Fairness in Machine Learning" to artykuł próbujący opisać typy uprzedzeń i stronniczości obecnych w danych. Ninareh Mehrabi i współautorzy zaproponowali ponad 20 typów stronniczości danych, wśród nich są te wynikające ze społecznych źródeł danych, ale też te będące efektem błędnego planowania danych i właściwości analiz statystycznych, takich jak np. Paradoks Simpsona. arxiv.org | #dane | 2021-03-01
  • 199. Deep Nostalgia: "ożywianie" twarzy z historycznych fotografii Serwis MyHeritage udostępnia opcję ożywiania twarzy na zdjęciach historycznych. Algorytm Deep Nostalgia przygotowany przez firmę D-ID przetwarza wizerunek osoby, dodając mimikę twarzy i ruch głowy. MyHeritage korzysta również z algorytmu Face Anonymization - pozwala on na zaawansowaną anonimizację wizerunku osób udostępniających swoje zdjęcia w tym serwisie. Należy dodać, że wobec serwisu stawiane są zarzuty braku odpowiedniej dbałości o dane osobowe. W 2018 roku z MyHeritage wyciekło 92 mln adresów email i haseł użytkowników. www.myheritage.pl | #ai | 2021-02-27
  • 198. Media społecznościowe negatywnie wpływają na sen Amandeep Dhir i współautorzy opisują fizjologiczne konsekwencje intensywnego korzystania z mediów społecznościowych. Przygotowana przez nich analiza bada związek między stalkingiem w mediach społecznościowych i nieustannym dbaniem o własny wizerunek a zaburzeniami snu. Badania na 876 użytkownikach i użytkowniczkach wykazują, że kompulsywne korzystanie z mediów społecznościowych niszczy higienę snu. Przytaczana literatura opisuje negatywny wpływ mediów społecznościowych na długość snu, jego regularność czy spanie w najbardziej odpowiednich porach. onlinelibrary.wiley.com | #media społecznościow | 2021-02-27
  • 197. Automatio.co - łatwe budowanie skraperów bez programowania Automatio.co to nowa usługa pozwalająca na proste konstrowanie scraperów do pobierania danych ze stron WWW. Tworzone w tym systemie scrapery obsługują nie tylko parsowanie kodu HTML w celu wyodrębniania interesujących nas treści, ale także kliknięcia, przewijanie stron, logowanie do kont, tworzenie screenshotów czy wpisywanie znaków do pól wyszukiwania. Możliwy jest eksport danych do plików JSON i CSV. Usługa nie jest jeszcze w pełni dostępna - należy aplikować o early access. automatio.co | #www | 2021-02-26
  • 196. #Polihistor Centrum Polsko-Rosyjskiego Dialogu i Porozumienia udostępnia na YouTube materiały edukacyjne związane z historią relacji polsko-rosyjskich. W programie #Polihistor historyk Bartosz Gajos rozmawia z ekspertami od historii Polski i Rosji między innymi o tym, dlaczego Katarzyna II bała się polskiej rewolucji, czy Polska mogła uniknąć II wojny, dlaczego Sowieci dokonali agresji dopiero 17 września oraz w jakim celu Kreml inwestuje miliony rubli w projekty związane z historią. Centrum Polsko-Rosyjskiego Dialogu i Porozumienia jest państwową osobą prawną, powołaną z mocy ustawy, nadzorowaną przez Ministerstwo Kultury i Dziedzictwa Narodowego. www.youtube.com | #historia publiczna | 2021-02-26
  • 195. Ukryte koszty kupowania na Amazonie Aby zamówić książkę przez Amazon, użytkownik musi przejścia przez dwanaście różnych interfejsów. Autorce projektu "The Hidden Life of an Amazon User" udało się prześledzić 1307 requestów do wszelkiego rodzaju skryptów i dokumentów, było to w sumie 8,724 stron A4 wydrukowanego kodu źródłowego o objętości 87.33MB. Przygotowana przez nią wizualizacja informuje o kosztach środowiskowych tego procesu, które przerzucane są na użytkownika. Koszty te należałoby doliczyć do kosztów kupna książki w Amazonie. www.janavirgin.com | #oprogramowanie | 2021-02-26
  • 194. Praktyka ochrony zbiorów audiowizualnych (raport technologiczny) W październiku zeszłego roku Digital Preservation Coalition wydała opracowanie podsumowujące metody i strategie ochrony zbiorów audiowizualnych. Raport przedstawia podstawowe informacje o cechach plików audiowizualnych, najlepsze praktyki w zakresie ich wieczystego zabezpieczania oraz wyzwania z tym związane, m.in. ryzyka prawne, kontrowersje etyczne, problemy wynikające z ewolucji sprzętu komputerowego czy koszty finansowe. Przygotowano także studia przypadku z Międzynarodowej Agencji Energetyki Atomowej, archiwów zespołu Marka Morrisa, znanego amerykańskiego tancerza oraz Borthwick Institute for Archives na Uniwersytecie w Yorku. www.dpconline.org | #archiwa | 2021-02-24
  • 193. Europejskie Archiwum Webu? Archive.eu gromadzi kopie stron WWW z domen krajowych państw europejskich. Wbrew pozorom, nie jest prowadzone przez jakąkolwiek instytucję Unii Europejskiej ani przez nią finansowane. Kopie stron pozbawiane są kodów JavaScript oraz zasobów wczytywanych ze źródeł zewnętrznych - mocno wpływa to na jakość zachowanych zbiorów. Na stronie nie znajdziemy żadnych informacji o tym, kto je tworzy i na jakich zasadach gromadzi i udostępnia zasoby. Domena archive.eu została zarejestrowana przez czeskie przedsiębiorstwo Kleissner Investments, a projekt prowadzony jest w ramach marki Intelligence X - usługi indeksowania i przeszukiwania zasobów Webu. Archiwum - a raczej projekt archiwalny - indeksuje też polskie zasoby - około 2 mln domen. archive.eu | #webarchiving | 2021-02-23
  • 192. W czasie lockdownu rośnie liczba edycji Wikipedii Analiza 223 milionów edycji z 12 wersji językowych Wikipedii z lat 2018-2020 pozwoliła wykazać, że pandemia i lockdown przełożyły się na zwiększenie liczby edycji oraz zwiększenie liczby osób w społeczności. Jak przekonują autorzy, edycje w anglojęzycznej Wikipedii wzrosły o 20 proc. od poziomu, jaki możnaby zakładać na podstawie analizy danych z lat poprzedzających pandemię. Wzrosty liczby edycji przekraczają założenia także w Wikipediach w włoskim, niemieckim, francuskim, koreańskim i japońskim - dzieje się to jednak po krótkotrwałym szoku, wyraźnym spowolnieniu edycji, spowodowanym zakazem przemieszczania się. arxiv.org | #wikipedia | 2021-02-22
  • 191. Pierwsza analiza dostępności historycznych zasobów polskiego Webu Współcześnie dostępnych jest niecałe 22 proc. badanych adresów URL z wydanego w 1997 roku drukowanego katalogu stron WWW "Polish World". Równocześnie prawie 80 proc. adresów jest dostępnych w archiwach Webu - nie oznacza jednak, że została zachowana ich oryginalna postać. dx.doi.org | #webarchiving | 2021-02-22
  • 190. MetaHuman Creator: łatwe generowanie realistycznych postaci 3D MetaHuman Creator to edytor 3D pozwalający na tworzenie hiperrealistycznych postaci ludzkich. Wygenerowanie postaci ma trwać do godziny: wybrać można cechy twarzy i skóry, typ sylwetki, płeć, styl ubioru i uczesania. Postać renderowana jest w silniku Unreal Engine. Usługa ma zastosowanie przy produkcji gier 3D, może być jednak wykorzystana także np. w muzealnych prezentacjach multimedialnych. www.unrealengine.com | #3d | 2021-02-19
  • 189. Digital Humanities Awards: nominacje za 2019 rok Dostępna jest już lista publikacji, wydarzeń i projektów, zgłoszonych do nagrody Digital Humanities Awards za 2019 rok. DHA organizowana jest od 2012 roku i jej celem jest wyróżnienie 'talentu i doświadczenia w społeczności humanistyki cyfrowej'. Nominacje i głosowanie jest otwarte dla wszystkich, z nagrodą nie są związane żadne korzyści finansowe. dhawards.org | #dh | 2021-02-18
  • 188. Nadawanie priorytetu oryginalnym wiadomościom na Facebooku Artykuł napisany przez zespół badaczy z Facebooka, pokazujący algorytm wyliczania pozycji treści w feedzie tego serwisu społecznościowego. Algorytm analizuje m.in. relacje między newsami i stopień ich podobieństwa, a także zakres zmiany słów w tekście kolejnych wersji tej samej informacji. Tekst jest dobrym wstępem do zaawansowanej analizy systemu publikowania i filtrowania na Facebooku, tym bardziej, że informacje o algorytmie pochodzą z oficjalnego źródła. arxiv.org | #media społecznościow | 2021-02-18
  • 187. ink: język skryptowy do pisania interaktywnych opowiadań Ink może być wykorzystany do pisania interaktywnej prozy albo konstruowania gier tekstowych. Przygotowanie projektu w tym języku nie jest trudne, jeśli korzysta się z dedykowanego edytora. Edytor pozwala na bieżąco testować poszczególne leksje oraz generować proste strony WWW zawierające grę. www.inklestudios.com | #gry | 2021-02-18
  • 186. Federated Learning (FL): kolektywne, zdecentralizowane uczenie maszynowe Federated Learning FL to nowy paradygmat uczenia maszynowego, w którym nie ma centralnego ośrodka przetwarzania i przechowywania danych. Jednym z wdrożeń FL jest FLeet, system uczenia maszynowego bazujący na sieci smartfonów z Androidem. System wykorzystuje baterie smartfonów w bardzo ograniczonym stopniu (0.036 proc. baterii dziennie) i gwarantuje, że dane użytkowników wykorzystane do obliczeń nie zostaną zagregowane centralnie. dl.acm.org | #ai | 2021-02-16
  • 185. Indeks Hirscha nie jest już dobrym wskaźnikiem renomy naukowej Autorzy opracowania zebrali dane o najczęściej cytowanych autorach z dziedzin takich jak biologia, informatyka, ekonomia i fizyka. Analiza 3.9 mln artykułów i 323 milionów cytatów wykazała, że korelacja poziomu indeksu Hirscha z otrzymywaniem nagród naukowych, wskaźnikiem pozycji w świecie naukowym, wyraźnie zmalała. W ramach badania zebrano dane o ponad 10 tys. nagród naukowych, począwszy od lat 70. - autorzy sugerują, że konieczne jest przemyślenie znaczenia indeksu-h w ocenie dorobku naukowego i systemach grantowych. Artykuł uzupełniają interaktywne wykresy. arxiv.org | #nauka | 2021-02-15
  • 184. Facebook: społecznościowe agregowanie kont zmarłych osób Profiles de Gente Morta to brazylijska społeczność facebookowa, której celem jest agregowanie informacji o osobach niedawno zmarłych, których profile dostępne są w tym serwisie społecznościowym. Osoby angażujące się w PGM chcą upamiętniać zmarłych, szczególnie w okresie pandemii, kiedy organizacja tradycyjnych pogrzebów jest zakazana - szukają też danych na stronach zakładów pogrzebowych. Społeczność wypracowała szczegółowy schemat publikowania informacji o zmarłych, nad przestrzeganiem zasad czuwają moderatorzy. Początki PGM sięgają lat 00. i serwisu Orkut, na Facebooku grupa liczy prawie 155 tys. osób. restofworld.org | #media społecznościow | 2021-02-12
  • 183. Archiwizacja Webu to tylko przybliżanie przeszłych zasobów Granica między materiałem wartym zarchiwizowania a papką zalewającą kanały komunikacji w Internecie, staje się coraz cieńsza - czytamy w eseju o archiwizacji Webu, opublikowanym w Lapham’s Quarterly. Reakcją na postępującą erozję starych zasobów WWW może być nie tylko poczucie rozgoryczenia z powodu braku dostępu i kontroli, ale też akceptacja, jakby tymczasowość miała być 'naturalną' cechą zasobów cyfrowych. Czy można to jakoś rozwiązać? Archiwizacja Webu jest zawsze tylko przybliżaniem tego, co kiedyś było dostępne. www.laphamsquarterly.org | #webarchiving | 2021-02-12
  • 182. Zmediatyzowana pamięć w epoce algorytmów [PDF] "'You Have a New Memory': Mediated Memories in the Age of Algorithms" to praca doktorska obroniona na Uniwersytecie Nowojorskim. Na bazie wywiadów, badań czterech grup fokusowych i analizie technologii autor opisuje wpływ, jaki mechanizmy filtrujące mediów społecznościowych oraz systemy wyszukiwania wpływają na kształtowanie wspomnień. Autor odwołuje się w tym zadaniu także do teorii archiwów cyfrowych. Osobom zainteresowanym tematem mediatyzacji pamięci bibliografia pracy może przydać się do odkrycia nowych lektur. etheses.whiterose.ac.uk | #media społecznościow | 2021-02-11
  • 181. Software studies i kreatywne kodowanie w JavaScript: podręcznik [PDF] Wydawnictwo Open Humanities Press udostępniło książkę 'Aesthetic Programming: A Handbook of Software Studies' (autorstwa Winnie Soon i Geoffa Coxa). To podręcznik programowania w JavaScript (w bibliotece p5.js), którego celem - jak czytamy we wstępie - nie jest jedynie przekazanie umiejętności technicznych. Ma uczyć tego, w jaki sposób czytać, pisać i myśleć z kodem i przez kod. Programowanie jest dla autorów dynamiczną praktyką kulturową - stąd też tytuł książki, powstałej na bazie stacjonarnego kursu prowadzonego na Uniwersytecie w Aarhus w Dani. Książka dostępna jest na licencji CC BY-SA. www.openhumanitiespress.org | #software studies | 2021-02-10
  • 180. Tkanina z Bayeux w wysokiej rozdzielczości, ale bez swobody wykorzystania Muzeum Bayeux opublikowało na swojej stronie cyfrową reprodukcję tkaniny z Bayeux w wysokiej rozdzielczości. Słynny zabytek z drugiej połowy XI wieku przeglądać można także poruszając się po transkrybowanych fragmentach inskrypcji, tłumaczonych dodatkowo z łaciny na angielski i francuski. Należy dodać, że muzeum zabrania komercyjnego wykorzystania udostępnionych skanów. www.bayeuxmuseum.com | #digitalizacja | 2021-02-10
  • 179. Microsoft opatentował metody generowania botów z danych zmarłych osób Budowany metodami opisanymi w patencie bot ma "reprezentować" konkretną osobę, przy czym może to być osoba żyjąca lub zmarła, krewny, znajomy, celebryta, postać historyczna czy fikcyjna albo osoba przypadkowa (chodzi tu przede wszystkim o wiarygodność konwersacji, a nie prawdziwość postaci). Źródłem danych mają być zdjęcia, nagrania mowy, wpisy w mediach społecznościowych, poczta elektroniczna czy nawet zdigitalizowane listy. Generowanie bota pozwalać ma na modyfikowanie 'wyliczonej' ze zbiorów cyfrowych osobowości - w patencie określa się ją jako "personal index". Opisany w patencie bot ma pozwalać na podejmowanie konwersacji w trybie tekstowym i audio. pdfpiw.uspto.gov | #ai | 2021-02-09
1 2 3 4 5 6 7