Kto korzysta z API?

W najnowszym numerze International Journal of Digital Curation, czasopisma wydawanego od 2006 r. przez Digital Curation Centre, ukazał się artykuł poświęcony wykorzystaniu API przez badaczy z obszaru humanistyki i nauk społecznych – APIs and Researchers: The Emperor’s New Clothes? Artykuł jest podsumowaniem badań bazujących na zebraniu danych zastanych oraz na 11 rozmowach z naukowcami, programistami oraz bibliotekarzami.

API, czyli Application Programming Interface, to jedno z najpopularniejszych narzędzi do pobierania danych. Jest to zestaw reguł, dzięki którym programy przekazują sobie automatycznie informacje. Narzędzia te są wykorzystywane w wielu sytuacjach, a umożliwienie łatwego pobierania dużych zestawów danych z portalu to jedno z zastosowań. Pobieranie w ten sposób danych ułatwiają biblioteki cyfrowe, repozytoria i inne serwisy. Autorki artykułu, afiliowane przy dublińskim Trinity College, zwracają uwagę, że presja na wdrażanie API w serwisach jest duża, ale naukowcy rzadko wykorzystują to narzędzie. Jeszcze rzadziej w opisie swoich projektów informują o korzystaniu z tej metody pozyskiwania danych. Europeana, europejski agregator bibliotek cyfrowych, z którą badaczki współpracowały w ramach projektu CENDARI, stara się dostosowywać bardziej do potrzeb naukowców, niż programistów. Badacze zbierają wciąż często dane w sposób „analogowy”.

W artykule wskazano różne sposoby budowania API. HathiTrust Digital Library zbudowało dwa API – jedno przeznaczone na metadane, a drugie na właściwe obiekty. Z kolei British Library usunęło pierwotne publicznie dostępne API, a obrazy udostępnia za pośrednictwem serwisu Flickr Commons.
Użytkownicy zwracają uwagę m.in. na potrzebę pracy nad jakością metadanych. Wyrażano różne poglądy na temat konieczności posiadania przez badaczy-humanistów przynajmniej podstawowych kompetencji programistycznych.

Warto zwrócić uwagę na artykuł irlandzkich autorek. Dotyka on bardzo konkretnego aspektu pracy z cyfrowymi danymi. Z jednej strony opracowanie największych nawet zbiorów cyfrowych nie sprawi, że nastąpi jakościowa zmiana w metodach prowadzenia badań, jeśli sami naukowcy nie będą chcieli z tych danych korzystać w sposób inny niż dotychczas. Z drugiej zaś strony, brak informacji, w jaki sposób zbiory cyfrowe mogą być wykorzystywane sprawia, że programiści wprowadzają rozwiązania takie, jakie
sami uznają za rozsądne. Dysponujemy coraz większą liczbą dużych zbiorów cyfrowych źródeł, ale pracujemy z nimi w sposób znany ze świata analogowego. Potrzeba wspólnej pracy naukowców i programistów, by rozwinąć narzędzia przydatne w rzeczywistej pracy badawczej oraz by badacze w większym stopniu zdali sobie sprawę z narzędzi, które już są dla nich dostępne.