Die Basis drängt darauf, Indiens wertvollste Dokumente zu digitalisieren

Darüber hinaus sind die meisten öffentlichen Bibliotheken für die Öffentlichkeit nicht frei zugänglich. „Der Zugang zu vielen unserer öffentlichen Bibliotheken ist so schwierig, und irgendwann werden die Leute aufhören, um Zugang zu bitten. Das ist auch in vielen unserer öffentlich finanzierten Bildungseinrichtungen der Fall“, sagt Arul George Scaria, außerordentlicher Professor an der National Law School der India University Bengaluru, der sich mit dem Recht des geistigen Eigentums beschäftigt. Eine der besten Möglichkeiten, den Zugang zu diesen Bibliotheken zu erleichtern, sei die Digitalisierung, sagt er.

Der Technologe Omshivaprakash H L spürte den akuten Mangel an solchen Ressourcen, als er Referenzen zum Schreiben von Wikipedia-Artikeln in Kannada, einer südwestindischen Sprache, benötigte. Etwa im Jahr 2019 hörte er, dass Carl Malamud, der Leiter von Public Resource, einer eingetragenen US-amerikanischen Wohltätigkeitsorganisation, bereits Bücher wie Gandhis Hind-Swaraj-Sammlung über indische Selbstverwaltung und Werke der indischen Regierung im öffentlichen Bereich archiviert. „Ich wusste auch, dass er viele dieser Bücher in Antiquariaten kaufte und sie in die USA mitnahm, um sie digitalisieren zu lassen“, sagt Omshivaprakash.

Public Resource hatte mit der Indischen Akademie der Wissenschaften in Bengaluru zusammengearbeitet, um ihre Bücher mithilfe eines vom Internet Archive bereitgestellten Scanners zu digitalisieren, doch die Bemühungen ließen nach. Omshivaprakash schlug vor, Community-Mitglieder zur Hilfe zu bewegen. An den Wochenenden begannen diese Freiwilligen, einige der Bücher zu scannen, die Omshivaprakash hatte und die Malamud gekauft hatte. „Carl verstand wirklich die Idee der Community-Zusammenarbeit, die Idee der lokalen Sprachtechnologie, die wir brauchten, und die Art von Wirkung, die wir erzielten“, sagt Omshivaprakash.

Die Scanner verwenden eine V-förmige Halterung zum Halten der Bücher und zwei DSLR-Kameras zum Erfassen der Seiten in hoher Auflösung. Das Gerät basiert auf dem Scanner des Internet Archive, wurde jedoch von Omshivaprakash überarbeitet und in Indien zu geringeren Kosten hergestellt. Jeder Mitarbeiter kann etwa 800 Seiten pro Stunde scannen.

Die wichtigeren Teile des Vorgangs finden nach dem Scan statt: Freiwillige stellen sicher, dass genaue Metadaten verwendet werden, um die Scans im Internetarchiv auffindbar zu machen, und die optische Zeichenerkennung wurde optimiert, um für eine Reihe indischer Sprachskripte besser zu funktionieren macht den Text über Text-to-Speech-Programme durchsuchbar und zugänglich.

Public Resource finanziert das SoK-Projekt und Omshivaprakash verwaltet den Betrieb mit Hilfe von Mitarbeitern und Freiwilligen. Die Zusammenarbeit erfolgte über soziale Medien und Mundpropaganda. Beispielsweise wandte sich ein Gemeindemitglied und Kannada-Lehrer namens Chaya Acharya an Omshivaprakash mit Zeitungsausschnitten von Arbeiten ihres Großvaters, des renommierten Journalisten und Schriftstellers Pavem Acharya, der Artikel zu wissenschaftlichen und sozialen Themen sowie satirische Essays schrieb. Unerwartet fand sie weitere Artikel ihres Großvaters in der bestehenden Sammlung „Servants of Knowledge“. „Allein durch die Suche nach seinem Namen habe ich viele weitere Artikel aus dem Archiv gefunden“, sagt sie. Sie begann, Exemplare von Kasturi zu sammeln, einem bekannten Kannada-Monatsmagazin, das Pavem Acharya von 1952 bis Anfang 1975 herausgegeben hatte, und gab sie Omshivaprakash zur Digitalisierung. Die alten Ausgaben des Magazins enthalten seltene Schriften und Übersetzungen bekannter Kannada-Autoren, wie z Indirabai von Gulavadi Venkata Rao, der als erster moderner Roman in Kannada gilt, und eine Kannada-Übersetzung von Edgar Allan Poes berühmter Kurzgeschichte „The Gold-Bug“.

source site

Leave a Reply