• 从2021年4月起,论坛网上药店重新开放!详情查看
  • 从2023年10月10日开始,华夏中医论坛启用备用域名tcmbe.com 详情查看
  • 关于论坛电子书等资源下载权限的说明!详情查看
  • 论坛官方QQ群,2000人大群,欢迎加入!详情查看

电子书 中医古籍珍稀抄本精选(全套共53种54册本纯文字版) 上海科技出版社 2004年 PDF 下载

要是手工替换文字规律如下:
园——0
员——1
圆——2
猿——3
源——4
缘——5
远——6
苑——7
愿——8
怨——9
豫——%
!——①
"——②
# ——③
$——④

不建议用替换文字的方式修改pdf文件,换了字体后虽然还不完美,但是书籍内容不受影响。
 
要是手工替换文字规律如下:
园——0
员——1
圆——2
猿——3
源——4
缘——5
远——6
苑——7
愿——8
怨——9
豫——%
!——①
"——②
# ——③
$——④

不建议用替换文字的方式修改pdf文件,换了字体后虽然还不完美,但是书籍内容不受影响。
这个不能替换的,很可能会出现正文字被替换的错误状况。
 
在研究过程中发现两个小技巧,可能大家都会,但是发上来给需要的朋友。
1、给pdf文件批量替换"字体"
使用的是“极速PDF编辑器”(官网免费下载使用https://jisupdf.com/
1710732702679.png

2、给"pdf文字版"文件批量替换"文字"
使用的是“福昕PDF编辑器”(避免大家到处找,将我搜到的资源放上来(来源网络,怕病毒什么的自行查找资源),什么时候失效不清楚,需要的及时下载)
资源1:百度网盘地址(点击打开) 提取码:2yri
资源2:百度网盘地址(点击打开) 提取码:sg6h
1710733199529.png
 
最后编辑:
在研究过程中发现两个小技巧,可能大家都会,但是发上来给需要的朋友。
1、给pdf文件批量替换"字体"
使用的是“极速PDF编辑器”(官网免费下载使用https://jisupdf.com/
浏览附件161820
2、给"pdf文字版"文件批量替换"文字"
使用的是“福昕PDF编辑器”(避免大家到处找,将我搜到的资源放上来(来源网络,怕病毒什么的自行查找资源),什么时候失效不清楚,需要的及时下载)
资源1:百度网盘地址(点击打开) 提取码:2yri
资源2:百度网盘地址(点击打开) 提取码:sg6h
浏览附件161822
大佬方便的话,可以放一套替换字体后的正确版本,刚才我就在想替换字体应该是最好的,这PDF估计是用了方正748字体才导致乱码的,把这些字体替换成操作系统内置的英文字体,就能完美解决问题。
 
大佬方便的话,可以放一套替换字体后的正确版本,刚才我就在想替换字体应该是最好的,这PDF估计是用了方正748字体才导致乱码的,把这些字体替换成操作系统内置的英文字体,就能完美解决问题。
试过了,没成功。技术到这了,看看其他朋友谁有办法。
 
试过了,没成功。技术到这了,看看其他朋友谁有办法。
1这个乱码的文件是方正排版的。用方正软件Apabi Reader,可以打开也没有乱码。只是拒绝打印了,只能另存。另存为就会出现乱码了。如果不介意的话就用方正软件看吧。都有书签和无乱码。

2如果强行打印也可以,要修改一下虚拟打印机名的格式,中间加一横。附件4图中有红色那一点就是。但是打印出来的是图片格式而且没有书签,并且没有乱码现象。如果你有闲时可以再补入书签再用adobe软件过一遍弄成搜索的。

3如果有排版的高手可以根据方正软件打开文件时再弄出字体文件,这样应该是可以的。到时候导入估计行。

4.方正软件可以转出txt文本,可以对照pdf全面搜索字符串改。

5.方正软件Apabi Reader可以自己下载。第一个就是。自己搜索一下北京方正阿帕比。

目前暂时还没有搜到更好的办法。

方正书版对西文的处理一直都是个奇葩 书版生成的大样,或者也叫二扫文件,无论西文还是汉字,都是用双字节方式来存储,也就是取这个字符的 748 码,然后将高低字节倒过来,储存在大样文件里。

例如汉字“啊”编码是 B0A1H,在早期书版 6.x 版本生成的 S2 文件中,储存时就是 A1H、B0H 两个字节,在这两个字节前面又有两个字节,来表示这个“啊”字左边缘的水平坐标,这样的四个字节一个一个串起来,在它们的最前面又有专门的标记表示这一串字符共同的垂直坐标、以及字体等信息,就构成了版面上的一行,许多个这样的一行合在一起,就成了一整页的文字了。
 

附件

  • 005.jpg
    005.jpg
    185.8 KB · 查看: 20
  • 004.jpg
    004.jpg
    123 KB · 查看: 21
  • 003.jpg
    003.jpg
    432.6 KB · 查看: 23
  • 002.jpg
    002.jpg
    417.8 KB · 查看: 22
  • 001.jpg
    001.jpg
    476.1 KB · 查看: 22
最后编辑:
已经找到方法:
1.用方正软件Apabi Reader,选“Microsoft Print To PDF”打印直接就是PDF文件。
2.再用福昕PDF打开原来的文件导出目录标签。
3.然后用福昕PDF打开新的文件,导入目录文件,此时发现目录标签没有激活。
4.最后用PCE目录制作软件导入文件目录,发现目录后面多了一些东西”页“字,用PCE软件批量删除修正即可。
整个过程虽然多了几个步骤,但总算是群策群力解决了。
 

附件

  • SharedScreenshot.jpg
    SharedScreenshot.jpg
    134 KB · 查看: 20
最后编辑:
根据前面各位的分析,这套文字版pdf共54册,其中30册有数字乱码问题,24册没有乱码。
乱码问题的主要原因其实就是pdf 内没有嵌入所需的方正字体。

经过几天的摸索与尝试,总算完成了优化,基本解决数字乱码问题,补齐了书签,统一了页面大小,可读性大大提高。
具体优化步骤如下:
1、安装方正 Apabi Reader 软件,打开安装目录里的字体目录Resource\Font\,将所有字体复制到系统字体目录(C:\Windows\Fonts\);
2、用福昕PDF 打开有乱码的文件,确认数字没有了乱码问题;并对所有文件名进行调整,前面加上序号标明是第几册,便于阅读;
3、在福昕PDF 中打开批量打印功能,打印机选择“Foxit PDF Editor Printer”,打印机配置里设置“嵌入所有字体”,设置保存文件夹路径;
4、选择有乱码问题的30个pdf文件,页面范围设置全部页,纸张大小选A4,开始批量打印,耗时较长。打印出来的新文件就嵌入了所需字体,在其他电脑查看也不会乱码了。
5、对于没有乱码问题的24个文件,不需要重新打印,只调整了页面大小,统一为 A4;
6、用 FreePic2Pdf 批量提取原pdf文件的书签,原文件没有书签或书签乱码的,用福昕PDF的OCI功能识别并提取目录,并且都增加了书名前言目录等书签;
7、用 FreePic2Pdf 批量导入已修正的书签内容到新pdf文件内容,并检查书签是否准确;
8、用福昕PDF 打开新pdf文件,使用PDF优化功能对文件进行优化,压缩文件大小。

当然还有一些标点符号与汉字重叠的问题,没找到原因和解决方案,但也不影响阅读了。
并且在优化书签过程中,发现这套文字版和另外一帖的扫描版有少许文字存在差异,建议对照阅读。

优化效果:
优化效果.png

附 原始没有数字乱码问题的文件列表:
中医古籍珍稀抄本精选02:济世珍宝.pdf
中医古籍珍稀抄本精选02:一见能医.pdf
中医古籍珍稀抄本精选04:吴氏医方汇编.pdf
中医古籍珍稀抄本精选04:医方絜度.pdf
中医古籍珍稀抄本精选04:诊验医方歌括.pdf
中医古籍珍稀抄本精选05:考证病源.pdf
中医古籍珍稀抄本精选05:儒医心镜.pdf
中医古籍珍稀抄本精选05:王乐亭指要.pdf
中医古籍珍稀抄本精选11:小儿诸证补遗.pdf
中医古籍珍稀抄本精选11:幼科惊搐门.pdf
中医古籍珍稀抄本精选11:原幼心法.pdf
中医古籍珍稀抄本精选15:江泽之医案.pdf
中医古籍珍稀抄本精选15:旌孝堂医案.pdf
中医古籍珍稀抄本精选15:王应震要诀.附程绍南医案.pdf
中医古籍珍稀抄本精选16:临症经应录.pdf
中医古籍珍稀抄本精选16:邵氏方案.pdf
中医古籍珍稀抄本精选17:李冠仙医案.pdf
中医古籍珍稀抄本精选17:沈菊人医案.pdf
中医古籍珍稀抄本精选17:王仲奇医案.pdf
中医古籍珍稀抄本精选18:贯唯集.pdf
中医古籍珍稀抄本精选18:叶天士曹仁伯何元长医案.pdf
中医古籍珍稀抄本精选19:临诊医案.pdf
中医古籍珍稀抄本精选19:汪艺香先生医案.pdf
中医古籍珍稀抄本精选19:徐养恬方案.pdf
 

附件

  • 中医古籍珍稀抄本精选(文字修复版).zip
    271.2 MB · 查看: 269
),-.":*,-.0#=$’
#=$*"xyz;{"
%¡¢,-.]N£¤":¥¦§"§¨©
ª %ª«o¤¬®¯"¨ª«o¤°°¯"±
²":³´µ¥¶%·|o¸¹º»¼"½¾¿ ’
’À ’Á ’ ’ÃR’®Ä ’ÅÆ ’Çn’Èl"ÉÊËÌ
Í ’ÎÏÐ "Ñw,-.]NÒ"ÓÔÕ¹ºÖ×% :014: 知道你们在聊,就是不到你们聊的啥,,
 
微信图片_20240409170247.png

用微信截图,之后复制出来的:
《沈菊人医案》由沈菊人高足李筱云(字茂才)、吕伯纯(字上舍)选编,其外甥张良标为之作序,惜未付梓。该书为沈菊人先生临症医案之一部分,分上下两卷。上卷列病症三十五门,下卷列病症二十二门,共收医案四百八十一例。所治病种非常广泛,包括内、外、妇、产、儿、老年、五官、口腔、男性、心理,并辅以针灸、导引等,可见沈菊人先生的医疗技术非常全面。
 
根据前面各位的分析,这套文字版pdf共54册,其中30册有数字乱码问题,24册没有乱码。
乱码问题的主要原因其实就是pdf 内没有嵌入所需的方正字体。

经过几天的摸索与尝试,总算完成了优化,基本解决数字乱码问题,补齐了书签,统一了页面大小,可读性大大提高。
具体优化步骤如下:
1、安装方正 Apabi Reader 软件,打开安装目录里的字体目录Resource\Font\,将所有字体复制到系统字体目录(C:\Windows\Fonts\);
2、用福昕PDF 打开有乱码的文件,确认数字没有了乱码问题;并对所有文件名进行调整,前面加上序号标明是第几册,便于阅读;
3、在福昕PDF 中打开批量打印功能,打印机选择“Foxit PDF Editor Printer”,打印机配置里设置“嵌入所有字体”,设置保存文件夹路径;
4、选择有乱码问题的30个pdf文件,页面范围设置全部页,纸张大小选A4,开始批量打印,耗时较长。打印出来的新文件就嵌入了所需字体,在其他电脑查看也不会乱码了。
5、对于没有乱码问题的24个文件,不需要重新打印,只调整了页面大小,统一为 A4;
6、用 FreePic2Pdf 批量提取原pdf文件的书签,原文件没有书签或书签乱码的,用福昕PDF的OCI功能识别并提取目录,并且都增加了书名前言目录等书签;
7、用 FreePic2Pdf 批量导入已修正的书签内容到新pdf文件内容,并检查书签是否准确;
8、用福昕PDF 打开新pdf文件,使用PDF优化功能对文件进行优化,压缩文件大小。

当然还有一些标点符号与汉字重叠的问题,没找到原因和解决方案,但也不影响阅读了。
并且在优化书签过程中,发现这套文字版和另外一帖的扫描版有少许文字存在差异,建议对照阅读。

优化效果:
浏览附件163290

附 原始没有数字乱码问题的文件列表:
中医古籍珍稀抄本精选02:济世珍宝.pdf
中医古籍珍稀抄本精选02:一见能医.pdf
中医古籍珍稀抄本精选04:吴氏医方汇编.pdf
中医古籍珍稀抄本精选04:医方絜度.pdf
中医古籍珍稀抄本精选04:诊验医方歌括.pdf
中医古籍珍稀抄本精选05:考证病源.pdf
中医古籍珍稀抄本精选05:儒医心镜.pdf
中医古籍珍稀抄本精选05:王乐亭指要.pdf
中医古籍珍稀抄本精选11:小儿诸证补遗.pdf
中医古籍珍稀抄本精选11:幼科惊搐门.pdf
中医古籍珍稀抄本精选11:原幼心法.pdf
中医古籍珍稀抄本精选15:江泽之医案.pdf
中医古籍珍稀抄本精选15:旌孝堂医案.pdf
中医古籍珍稀抄本精选15:王应震要诀.附程绍南医案.pdf
中医古籍珍稀抄本精选16:临症经应录.pdf
中医古籍珍稀抄本精选16:邵氏方案.pdf
中医古籍珍稀抄本精选17:李冠仙医案.pdf
中医古籍珍稀抄本精选17:沈菊人医案.pdf
中医古籍珍稀抄本精选17:王仲奇医案.pdf
中医古籍珍稀抄本精选18:贯唯集.pdf
中医古籍珍稀抄本精选18:叶天士曹仁伯何元长医案.pdf
中医古籍珍稀抄本精选19:临诊医案.pdf
中医古籍珍稀抄本精选19:汪艺香先生医案.pdf
中医古籍珍稀抄本精选19:徐养恬方案.pdf
感谢处理有问题书籍,更感谢将处理思路步骤全盘整理发表,十分钦佩!中医就需要这样的无私的精神。
 
后退
顶部