为什么需要在线化的电子课本?
国家中小学智慧教育平台提供了可复制文字的PDF格式教材,这是一个很好的资源。但PDF的固定布局在移动设备上的阅读体验并不理想——文字不会根据屏幕尺寸自适应调整,导致需要频繁缩放和滚动。
相比之下,HTML格式的电子课本具有明显优势:
- 真正的响应式设计:文本会基于设备屏幕尺寸自动重排
- 更佳的阅读体验:无论在手机、平板还是电脑上,都能获得合适的排版
- 更好的辅助功能:浏览器TTS语音朗读时不会因PDF中的错误换行而产生不自然的停顿
- 更快的访问速度:网页加载通常比PDF更加迅速
因此对个人学习而言,将 pdf 格式的电子课本的文本内容制作为 html ,使用 web 技术对其进行在线化是非常有价值的。本文将以 dors 中收集的中学历史课程的在线化制作为例,探讨如何制作易于访问的电子课本。
将教材制作为 web 页面过程中的技术挑战
将PDF教材制作为网页格式的电子课本时,为了确保文本内容的精确性,我没有尝试使用 AI 进行全文 OCR。制作的基本方式是进行文本复制,并使用 markdown 进行简单排版。
在此过程中,我主要遇到了两个技术问题:
1. 段落换行问题
直接从PDF复制的文本,每个视觉行的末尾都带有换行符。这些不符合语义的换行会破坏阅读流畅性,需要高效地移除。
2. 表格处理难题
教材中的表格手动转换极其耗时,需要工具自动识别表格结构并转换为合适的格式。
工具选择的思考
市场上已有一些在线工具可以解决这些问题,例如:
- UU在线工具 提供删除换行符功能
- 白描 和 olmocr.com 支持表格识别和转换:
- 白描提供的电子表格识别的能力可以将表格识别为 html ,然后可以直接复制 html。或者也可以将得到的 html 通过 tableconvert 转换成 markdown 后复制进 markdown 文档中。
- 也可以使用有大预言模型能力的 OCR,直接识别后生成 markdown,
将表格解析为 markdown 格式实际上会带来一些局限,因为 markdown 可能无法适应一些复杂表格的布局排版。
但在实际工作中,频繁在不同标签页间切换工具会打断工作流程,降低效率。这种碎片化的体验促使我思考:能否有一个更加集成的解决方案?
构建一站式工作台:Flowkit
基于这些实际需求,为了提升这项工作(以及别的工作)的体验,我开发了桌面端工作流整合应用 flowkit —— 一个可配置的工作流整合工具,它的核心理念是:为特定工作场景提供一站式的工具集合,减少上下文切换带来的效率损失。
正如上文中所描述的,处理一个流程(如表格的识别)可能会使用多种工具(如白描或 mistral),所以这个应用中应能灵活地选用工具,不给用户设限。
flowkit 中提供了预置的工具集:其中包含有在从 pdf 中复制文本这个场景下会用到的【文本处理工具】。
专为文本处理优化的工具
在PDF文本提取场景中,Flowkit的文本处理工具可以帮助删除删除段落内的多余换行。
同时,还可以通过选择相应模式,比如:删除换行的同时,保留段落之间的空行。这就允许用户复制多段文本进入工具中进行预处理,处理结果的每一段内都移除了不必要的空行,而段落间的换行却能得到保留,
深度集成的OCR功能
另一个有用的预置工具是 ocr 功能。虽然 olmocr.com 已经提供了不错的OCR服务,但Flowkit通过原生应用的优势,实现了更加无缝的体验:支持粘贴、拖拽和点击上传,界面更加简洁易用,使用起来十分方便。
实践成果
使用这套方法,我已经成功制作了多个中学教材的网页版本:
更多通过此方法制作的内容可以在知识库页面找到。
设计哲学
在 flowkit 这款工具的设计上,我始终坚持几个原则:
- 克制不张扬:功能足够解决实际问题即可,不做过度设计
- 体验优先:关注工作流程的顺畅度,而非功能数量
- 细节质感:在交互细节上体现对用户体验的考量
这种理念反映在Flowkit的每个设计决策中——从工具的选择逻辑到界面的视觉层次,都旨在为用户提供专注、高效的工作环境。
电子课本的在线化不仅是一项技术工作,更是对内容可访问性的提升。通过合适的工具和方法,我们能够为学习者创造更好的数字阅读体验。
本文介绍的工具和方法已在实践中验证其有效性,希望能为有类似需求的教育工作者和内容创作者提供参考。