• 从2021年4月起,论坛网上药店重新开放!详情查看
  • 从2023年10月10日开始,华夏中医论坛启用备用域名tcmbe.com 详情查看
  • 关于论坛电子书等资源下载权限的说明!详情查看
  • 论坛官方QQ群,2000人大群,欢迎加入!详情查看

电子书 中医古籍珍稀抄本精选(全套共53种54册本纯文字版) 上海科技出版社 2004年 PDF 下载

要是手工替换文字规律如下:
园——0
员——1
圆——2
猿——3
源——4
缘——5
远——6
苑——7
愿——8
怨——9
豫——%
!——①
"——②
# ——③
$——④

不建议用替换文字的方式修改pdf文件,换了字体后虽然还不完美,但是书籍内容不受影响。
 
要是手工替换文字规律如下:
园——0
员——1
圆——2
猿——3
源——4
缘——5
远——6
苑——7
愿——8
怨——9
豫——%
!——①
"——②
# ——③
$——④

不建议用替换文字的方式修改pdf文件,换了字体后虽然还不完美,但是书籍内容不受影响。
这个不能替换的,很可能会出现正文字被替换的错误状况。
 
在研究过程中发现两个小技巧,可能大家都会,但是发上来给需要的朋友。
1、给pdf文件批量替换"字体"
使用的是“极速PDF编辑器”(官网免费下载使用https://jisupdf.com/
1710732702679.png

2、给"pdf文字版"文件批量替换"文字"
使用的是“福昕PDF编辑器”(避免大家到处找,将我搜到的资源放上来(来源网络,怕病毒什么的自行查找资源),什么时候失效不清楚,需要的及时下载)
资源1:百度网盘地址(点击打开) 提取码:2yri
资源2:百度网盘地址(点击打开) 提取码:sg6h
1710733199529.png
 
最后编辑:
在研究过程中发现两个小技巧,可能大家都会,但是发上来给需要的朋友。
1、给pdf文件批量替换"字体"
使用的是“极速PDF编辑器”(官网免费下载使用https://jisupdf.com/
浏览附件161820
2、给"pdf文字版"文件批量替换"文字"
使用的是“福昕PDF编辑器”(避免大家到处找,将我搜到的资源放上来(来源网络,怕病毒什么的自行查找资源),什么时候失效不清楚,需要的及时下载)
资源1:百度网盘地址(点击打开) 提取码:2yri
资源2:百度网盘地址(点击打开) 提取码:sg6h
浏览附件161822
大佬方便的话,可以放一套替换字体后的正确版本,刚才我就在想替换字体应该是最好的,这PDF估计是用了方正748字体才导致乱码的,把这些字体替换成操作系统内置的英文字体,就能完美解决问题。
 
大佬方便的话,可以放一套替换字体后的正确版本,刚才我就在想替换字体应该是最好的,这PDF估计是用了方正748字体才导致乱码的,把这些字体替换成操作系统内置的英文字体,就能完美解决问题。
试过了,没成功。技术到这了,看看其他朋友谁有办法。
 
试过了,没成功。技术到这了,看看其他朋友谁有办法。
1这个乱码的文件是方正排版的。用方正软件Apabi Reader,可以打开也没有乱码。只是拒绝打印了,只能另存。另存为就会出现乱码了。如果不介意的话就用方正软件看吧。都有书签和无乱码。

2如果强行打印也可以,要修改一下虚拟打印机名的格式,中间加一横。附件4图中有红色那一点就是。但是打印出来的是图片格式而且没有书签,并且没有乱码现象。如果你有闲时可以再补入书签再用adobe软件过一遍弄成搜索的。

3如果有排版的高手可以根据方正软件打开文件时再弄出字体文件,这样应该是可以的。到时候导入估计行。

4.方正软件可以转出txt文本,可以对照pdf全面搜索字符串改。

5.方正软件Apabi Reader可以自己下载。第一个就是。自己搜索一下北京方正阿帕比。

目前暂时还没有搜到更好的办法。

方正书版对西文的处理一直都是个奇葩 书版生成的大样,或者也叫二扫文件,无论西文还是汉字,都是用双字节方式来存储,也就是取这个字符的 748 码,然后将高低字节倒过来,储存在大样文件里。

例如汉字“啊”编码是 B0A1H,在早期书版 6.x 版本生成的 S2 文件中,储存时就是 A1H、B0H 两个字节,在这两个字节前面又有两个字节,来表示这个“啊”字左边缘的水平坐标,这样的四个字节一个一个串起来,在它们的最前面又有专门的标记表示这一串字符共同的垂直坐标、以及字体等信息,就构成了版面上的一行,许多个这样的一行合在一起,就成了一整页的文字了。
 

附件

  • 001.jpg
    001.jpg
    476.1 KB · 查看: 13
  • 002.jpg
    002.jpg
    417.8 KB · 查看: 12
  • 003.jpg
    003.jpg
    432.6 KB · 查看: 14
  • 004.jpg
    004.jpg
    123 KB · 查看: 13
  • 005.jpg
    005.jpg
    185.8 KB · 查看: 14
最后编辑:
已经找到方法:
1.用方正软件Apabi Reader,选“Microsoft Print To PDF”打印直接就是PDF文件。
2.再用福昕PDF打开原来的文件导出目录标签。
3.然后用福昕PDF打开新的文件,导入目录文件,此时发现目录标签没有激活。
4.最后用PCE目录制作软件导入文件目录,发现目录后面多了一些东西”页“字,用PCE软件批量删除修正即可。
整个过程虽然多了几个步骤,但总算是群策群力解决了。
 

附件

  • SharedScreenshot.jpg
    SharedScreenshot.jpg
    134 KB · 查看: 8
最后编辑:
后退
顶部