NetLay: Layout Classification Dataset for Enhancing Layout Analysis

Sharva Gogawale - Tel Aviv University - email
Luigi Bambaci - École Pratique des Hautes Études (EPHE), France - email
Berat Kurar-Barakat - Tel Aviv University, Israel - email
Daria Vasyutinsky Shapira - Tel Aviv University, Israel - email
Daniel Stökl Ben Ezra - École Pratique des Hautes Études (EPHE), France - email
Nachum Dershowitz - Tel Aviv University, Israel - email

Abstract

Within the domain of historical document image analysis, the process of identifying the spatial structure of a document image is an essential step in many document processing tasks, such as optical character recognition and information extraction. Advancements in layout analysis promise to enhance efficiency and accuracy using specialized models tailored to distinct layouts. We introduce NetLay, a new dataset for benchmarking layout classification algorithms for historical works. It consists of over 1,300 images of pages of printed Hebrew (or Hebrew‑character) books in a variety of styles, categorized into four different classes based on their layout (the number of text columns and regions). Ground truth was crafted manually at the page level. Furthermore, we conduct an in‑depth performance evaluation of various layout classification algorithms, which are based on deep‑learning models that learn to extract spatial features from images. We evaluate our algorithms on NetLay and achieve state‑of‑the‑art results on the task of layout classification for historical books.

Open access | Peer reviewed

Presentato: 04 Aprile 2024 | Accettato: 23 Settembre 2024 | Pubblicato 17 Dicembre 2024 | Lingua: en

Keywords Layout classification • Convolutional neural networks • Multi‑label classification • Deep learning • Historical document analysis • Layout analysis

Copyright © 2024 Sharva Gogawale, Luigi Bambaci, Berat Kurar-Barakat, Daria Vasyutinsky Shapira, Daniel Stökl Ben Ezra, Nachum Dershowitz. This is an open-access work distributed under the terms of the Creative Commons Attribution License (CC BY). The use, distribution or reproduction is permitted, provided that the original author(s) and the copyright owner(s) are credited and that the original publication is cited, in accordance with accepted academic practice. The license allows for commercial use. No use, distribution or reproduction is permitted which does not comply with these terms.

Permalink http://doi.org/10.30687/mag/2724-3923/2024/02/003

↑ back to top

Leggi questo articolo

The Digital and the Public as Each Other’s Flip-Side in Today’s Humanities
Franz Fischer, Diego Mantoan, Barbara Tramelli
17 Dicembre 2024

Multilinguality in Action: Towards Linguistic Diversity and Inclusion in Digital Humanities
Alíz Horváth, Cosima Wagner, David Wrisley, Joanne Bernardi, Aanya Chadha, Danielle Garcia, Till Grallert, Sharanya Ghosh, Yuri Ishida, Aleksandra Kaye, Ahac Meden, Kiyonori Nagasaki, Dylan Palmer, Hugo Scheithauer, Marta Świetlik, Jeffrey Tharsen, Yifan Wang
17 Dicembre 2024

Building a Model of Sustainable Digital Ecologies for Archiving and Showcasing Grassroots Memory and Symbolic Reparation Initiatives
Ricardo Velasco Trujillo
17 Dicembre 2024

NetLay: Layout Classification Dataset for Enhancing Layout Analysis
Sharva Gogawale, Luigi Bambaci, Berat Kurar-Barakat, Daria Vasyutinsky Shapira, Daniel Stökl Ben Ezra, Nachum Dershowitz
17 Dicembre 2024

Fare e disfare l’archivio
Tra pratiche artistiche contemporanee e opzioni decoloniali a documenta fifteen
Giulia Crisci
17 Dicembre 2024

In Their Own Words: Disseminating Feminist Self-Art Histories in Sound Archives
Federica Martini, Julie Enckell
17 Dicembre 2024

DC Field	Value
dc.identifier	ECF_article_18143
dc.title	NetLay: Layout Classification Dataset for Enhancing Layout Analysis
dc.contributor.author	Bambaci Luigi
dc.contributor.author	Dershowitz Nachum
dc.contributor.author	Gogawale Sharva
dc.contributor.author	Kurar-Barakat Berat
dc.contributor.author	Stökl Ben Ezra Daniel
dc.contributor.author	Vasyutinsky Shapira Daria
dc.publisher	Edizioni Ca’ Foscari - Venice University Press, Fondazione Università Ca’ Foscari
dc.type	Articolo
dc.language.iso	en
dc.identifier.uri	http://edizionicafoscari.it/it/edizioni4/riviste/magazen/2024/2/netlay-layout-classification-dataset-for-enhancing/
dc.description.abstract	Within the domain of historical document image analysis, the process of identifying the spatial structure of a document image is an essential step in many document processing tasks, such as optical character recognition and information extraction. Advancements in layout analysis promise to enhance efficiency and accuracy using specialized models tailored to distinct layouts. We introduce NetLay, a new dataset for benchmarking layout classification algorithms for historical works. It consists of over 1,300 images of pages of printed Hebrew (or Hebrew‑character) books in a variety of styles, categorized into four different classes based on their layout (the number of text columns and regions). Ground truth was crafted manually at the page level. Furthermore, we conduct an in‑depth performance evaluation of various layout classification algorithms, which are based on deep‑learning models that learn to extract spatial features from images. We evaluate our algorithms on NetLay and achieve state‑of‑the‑art results on the task of layout classification for historical books.
dc.relation.ispartof	magazén
dc.relation.ispartof	Vol. 5 \| Num. 2 \| Dicembre 2024
dc.issued	2024-12-17
dc.dateAccepted	2024-09-23
dc.dateSubmitted	2024-04-04
dc.identifier.issn
dc.identifier.eissn	2724-3923
dc.rights	Creative Commons Attribution 4.0 International Public License
dc.rights.uri	http://creativecommons.org/licenses/by/4.0/
dc.identifier.doi	10.30687/mag/2724-3923/2024/02/003
dc.peer-review	yes
dc.subject	Convolutional neural networks
dc.subject	Deep learning
dc.subject	Historical document analysis
dc.subject	Layout analysis
dc.subject	Layout classification
dc.subject	Multi‑label classification
	Download data

download

articoli nello stesso fascicolo
citazioni
how to cite
metadati
open access
peer reviewed

magazén International Journal for Digital and Public Humanities

NetLay: Layout Classification Dataset for Enhancing Layout Analysis

Sommario

magazén International Journal for Digital and Public Humanities

NetLay: Layout Classification Dataset for Enhancing Layout Analysis

+ Sharva Gogawale, Luigi Bambaci, Berat Kurar-Barakat, Daria Vasyutinsky Shapira, Daniel Stökl Ben Ezra, Nachum Dershowitz

+ Note

+ Figure

+ Tabelle

+ Articoli nello stesso fascicolo

+ Citazioni

+ How to cite

+ Metadati

+ Informazioni

+ Condividi

Sommario