在内部设置了一个扫描工作站决于材料的类型。另一方面同等规模的文化古迹则需要多个箱子。扫描在项目中执行扫描。数字化使用专业级硬件允许您扫描最多格式的文本版本因此可以将格式的报纸开口数字化。大部分工作是通过扫描仪完成的它还配有一块玻璃用于强制和对齐开口。开始扫描文本版本时必须做出的最重要的决定是为数字化过程中获得的文件选择什么文件格式。
以书籍为例个盒子可容纳页
传统上格式被认为是文本和图像的正确格式但出于节省磁盘空间的原因我们选择了尽管它是商业性的但允许我们获得小得多 柬埔寨 WhatsApp 号码列表 的文件大小。我们估计在整个项目过程中将产生大约的数字化文本材料。分割项目中的分段是由进行的。从某种意义上说分段是布局的相反过程其中放置在页面上的内容被元素切割文章标题图像表格等。分割是在特殊软件的帮助下执行的该软件自动执行部分工作类似于文本识别光学字符识别。
诚然该程序并不总是能准确地成
也执行布局识别光学布局识别。功做到这一点因此仍然需要大量的手动后处理工作。分割过程涉及的员工数量比扫描多倍并且有人 喀麦隆 Whatsapp 数据 认为全卷分割是一个过于排他的过程例如世界上的一些图书馆仅通过文本识别进行管理但完整分割允许更多准确的信息搜索在单个文章的级别。有关数字化文本页内容的信息记录在和格式文件中例如由于对一份页的报纸进行数字化我们收到以下一组文件。