• 13. Trochę optymistycznych danych 23 mapy i wykresy mające pokazywać, że świat idzie raczej w dobrym kierunku. Zmniejszający się poziom radykalnego ubóstwa, ograniczenie zasięgu klęsk głodu i pracy dzieci, zwiększona dostępność czasu wolnego w krajach rozwijających... O kontekście podobnych danych (i w ogóle podejścia do interpretowania rzeczywistości w wielkiej skali) pisze np. Polityka www.vox.com #dane
  • 14. Poznajcie Emmę Ładnie złożona broszura i kolorowe wizualizacje danych mogą nie wystarczyć, kiedy chce się dotrzeć do odbiorców z przekazem naukowym. Raport „The Work Colleague of the Future" mówi o konsekwencjach zdrowotnych pracy biurowej, a jego częścią jest manekin wizualizujący zmiany w ciele. Emma ma 40 lat, od 20 pracuje na komputerze i jej wygląd, cera, postawa ciała zdecydowanie odbiega od współczesnych standardów. Swoją drogą warto zapytać, dlaczego wpływ środowiska pracy na ciało zdecydowano się zwizualizować akurat manekinem kobiety. www.fellowes.pl #dane
  • 59. Metadane 38 milionów URLi udostępnianych na Facebooku Social Science One (Harvard) we współpracy z Facebookiem przygotował zbiór metadanych na temat 38 mln adresów URL udostępnionych na Facebooku minimum 100 razy w okresie od 1 stycznia 2017 do 31 lipca 2019. Metadane opisują nie tylko sam URL, ale też reakcje użytkowników czy dane o zgłoszeniach do moderacji. Pełen opis zbioru dostępny jest w tym dokumencie. Aplikować o dostęp można na stronie Social Science One. socialscience.one #dane
  • 65. The most timeless songs The most timeless songs to projekt badający współczesną recepcję starej muzyki. Dzięki danym ze Spotify można wizualizować popularność starych utworów - zestawienia generowane dla poszczególnych lat czy dekad pozwalają pokazać, jaki przebój rzeczywiście wszedł do kanonu. Interpretując udostępnione dane warto zwrócić uwagę, że Spotify zlicza odtworzenia utworów bez rozróżnienia wieku użytkowników: na wizualizacje współczesnej recepcji starej muzyki mają więc wpływ także ci, którzy znają ją jeszcze ze swojej młodości. pudding.cool #dane
  • 77. Twitter modyfikuje zasady naukowego użycia swoich danych Twitter zmodyfikował swoje zasady dla deweloperów, aby ułatwić prowadzenie niekomercyjnych badań z wykorzystaniem jego API i danych. M.in. znika ograniczenie w objętości korpusów tweetów (a właściwie ich ID), które można legalnie udostępnić do badań. techcrunch.com #dane
  • 79. Problem dostępności danych w alternatywnych metrykach tekstów naukowych Autorzy zanalizowali 2.6 mln tweetów, publikowanych od 2007 roku i zawierających odniesienia do 1.5 tys. najczęściej cytowanych (via Altmetric) artykułów naukowych. Prawie 15 proc. z tych tweetów było niedostępnych w kwietniu 2019 roku, co może podważać wartość szacowania jakości tekstów naukowych z wykorzystaniem danych z mediów społecznościowych. doi.org #dane
  • 84. Epidemia dokumentowana na Twitterze - dostępne dane Na GitHubie udostępniane są kolejne części kolekcji 50 mln twittów dokumentujących pandemię koronawirusa (od 20 stycznia). Ze względu na ograniczenia wynikające z polityki Twittera wobec publikowania i przetwarzania danych, dostępne są jedynie numery identyfikacyjne twittów. Metoda gromadzenia została opisana w osobnej publikacji dostępnej na arXiv. github.com #dane
  • 87. Common Crawl - pozarządowa, otwarta alternatywa dla indeksu Google Common Crawl to projekt udostępniający dane na temat stron WWW indeksowanych w ramach szerokiej kwerendy. Artykuł w 'The Verge' porównuje go do Google, przy czym podkreśla, że Common Crawl udostępnia swoje dane za darmo i bez licencji. www.theverge.com #dane