对汉籍全文检索系统的AIxx分析
整理电脑硬盘,发现躺在某个角落里的汉籍全文检索系统,打开看了两眼,忽然想到,如今有了AI,能否借助于它来分析一下这个软件是怎么运行的。几年前下载到这个软件时,便想着能不能把里面的书籍都导出来。当时研究了一番,发现一种方式可以实现,就是使用其打印成pdf的功能,先导出为pdf再转为html格式。不过就是需要一篇篇去导,即使使用按键精灵,也是比较麻烦,…
枫叶荻花秋“瑟瑟”还是“索索”
网页链接:https://www.xinhuanet.com/politics/2016-09/19/c_129286686.htm。我赞同这篇文章,不过里面说“《琵琶行》首句当为陌、铎合韵。”我认为应该是协韵的关系。“索”字广韵三读,苏各切(sak)为形容词或名词义,山戟切(saak)和山責切(saek)实为一音,为动词义。“索索”当读苏各切(s…
OfficeSharp:把RoslynPad塞进Excel里
几年前,在一个博客网站那里看到了一篇文章:Data Spreads: Write your Excel Macros In C#(https://hotforknowledge.com/2016/10/31/5-data_spreads_excel_macros_in_csharp/),作者使用RoslynPad和ExcelDna做了个excel插…
《古音匯纂》文本mdx字典
看到这个标题很激动吧?嘿嘿,很抱歉让点开看的人失望了,其实这只是一个刚刚OCR的文本。 因为时不时地会查这本字典,阿弥佛陀网友做的图片版相当好用,只是有时候查询后想要复制些内容,或偶尔想要全文检索一下,这时图片版字典就无能为力了。 得益于阿弥佛陀网友精心制作的《古音匯纂》清晰图片切词版和良好的字头索引,利用这个周末,我用Abbyy把切词版的所有字头…
说文解字注灵字条“篆文之下以󲺑複寫其字,後人删之”
目前网上的说文解字注文本大部分来自于日本的一家网站,原网站只要有错,所有后来的都跟着错。今发现一例,灵字条:篆文之下以󲺑複寫其字,後人删之。删,源网站识别成了刚,于是一大片网站跟着成了刚。 也有正确的,可能另有来源。
网站被攻击
10月初国庆过完假回来,网站打不开了,后台一看,一个月的流量全都消耗完了,不得不暂时关闭。今天抽时间把网站套了个cloudflare,如果流量消耗再过快,网站就要重装了。
《汉语大字典》“嚱”字条,错得离谱
查“嚱”字,发现汉语大字典平声反切引用有误,《廣韻》虚宜切并没有明确收“嚱”字,尽管平声“戲”字可以从口,但《廣韻》也没说这个,所以这个反切不宜引用《廣韻》。仔细看,释义引用也有问题,平声引用的是《廣韻》《集韻》的去声条文,而去声释义引用的却是《集韻》的平声条文,刚好颠倒!而且第一条音韵地位标成了“平支明”,不知道“明”母从何而来。 纸质版上查了下…
“悔”字去声《古音匯纂》韵目标示错误
今天查《古音匯纂》“悔”字,发现“悔”字的去声韵目标示成了“蟹”: “悔”字 去声荒内切,《廣韻 》中属“隊”韵,《古音匯纂》中把“隊”字错印成成了“蟹”。这是pdf版,我没有纸质版,不知是不是pdf专有的错误。
小狼毫输入法实现一键繁简切换
由于PC端日常有输入繁体字的需求,而小狼毫默认的繁简切换方式是先按F4呼出菜单再方向键下移切换,或按Ctrl+Shift+4快捷键切换,然而我用的是五笔输入法(拼音和简入繁出方案),Ctrl+Shift+4快捷键的方式不知为什么并无效,后来在weasel的issue区(https://github.com/rime/weasel/issues/85…
openpyxl库读写excel的不足
几年前在使用openpyxl读写Excel的时候就发现,如果Excel内含切片器,那么openpyxl在保存Excel后,这些内容都会丢失;如果写入00:00时间,那么保存后时间会变成'29/12/1899 00:00:00'。因为是在本地端使用,所以可以通过换库,使用xlwings或pywin32库来解决这个问题。 这几天要用python处理Ex…