V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
maniaccn
V2EX  ›  程序员

搜狗词库全量打包--2020-11-08

  •  
  •   maniaccn · 2020-11-08 16:10:22 +08:00 · 13487 次点击
    这是一个创建于 1461 天前的主题,其中的信息可能已经有所发展或是发生改变。
    因为最近用小狼毫的输入法,但是无奈词库不精准,就把搜狗词库都下载了。共计 7764 个词库

    scel 文件夹是搜狗原版词库,可以根据自己需要下载
    scel.7z 是整体打包
    txt 文件夹是转换为 txt 文件
    txt.7z 是整体打包 txt 文件

    imewlconverter_Linux_Mac.tar.gz 深蓝词库转换器 mac 版本
    imewlconverter_Windows.zip 深蓝词库转换器 windows 版本

    因为不一定都需要下载,所以做了个解压过后的版本,方便根据自己需求进行下载。

    下载地址

    https://cloud.189.cn/t/eiUBv2YbUjEz (访问码:z33u )


    如果方便,麻烦帮忙回复一下,整了好几天。感谢。
    41 条回复    2022-09-26 11:52:01 +08:00
    gitopen
        1
    gitopen  
       2020-11-08 16:21:29 +08:00
    感谢楼主!
    gitopen
        2
    gitopen  
       2020-11-08 16:21:56 +08:00
    @gitopen 外链正在审核中
    yjxjn
        3
    yjxjn  
       2020-11-08 16:25:16 +08:00
    尊敬的用户,你访问的外链内容正在审核中,请稍后再访问,链接即将生效。
    maniaccn
        4
    maniaccn  
    OP
       2020-11-08 16:32:40 +08:00
    那就等等把,估计网盘审核呢。
    JamesR
        5
    JamesR  
       2020-11-08 16:46:22 +08:00
    4 年小狼毫用户路过,除了初次加载的词库外,自己词库要靠养,配合 OneDrive 开机同步即可,隐私和方便,就像鱼和熊掌一样不可兼得。
    maniaccn
        6
    maniaccn  
    OP
       2020-11-08 17:28:30 +08:00
    @JamesR 我正开始准备使用小狼毫,也是 onedrive
    blufaux
        7
    blufaux  
       2020-11-08 17:31:15 +08:00 via iPhone
    小狼有没有 iOS 的?可以用这个词库?
    lixingcong
        8
    lixingcong  
       2020-11-08 17:32:31 +08:00
    imewlconverter 转换的吧
    beyondex
        9
    beyondex  
       2020-11-08 17:37:08 +08:00
    感谢 实用
    KHfqLAYYS6BKJT3R
        10
    KHfqLAYYS6BKJT3R  
       2020-11-08 18:05:42 +08:00 via Android
    gboard 也可以么?
    imn1
        11
    imn1  
       2020-11-08 18:07:04 +08:00
    网上其实有小狼毫搜狗词库,只是不太新
    搜 luna_pinyin.sgmain.dict.yaml 能找到,几十万条
    Kagari
        12
    Kagari  
       2020-11-08 18:22:25 +08:00 via Android
    有啥小狼毫开箱即用的方案吗
    spaceman
        13
    spaceman  
       2020-11-08 18:55:24 +08:00
    我也是研究了好一阵子小狼毫,现在放弃了... Mac 上虽然还在用鼠须管但是 windows 放弃了。
    gladuo
        14
    gladuo  
       2020-11-08 21:36:22 +08:00
    Cool
    eggcn
        15
    eggcn  
       2020-11-08 23:00:34 +08:00
    老掉牙的别折腾了,就好比新款车子不买偏偏喜欢自己 DIY 小推车,美其名曰推着舒服适合自己
    NOspy
        16
    NOspy  
       2020-11-08 23:26:29 +08:00   ❤️ 2
    你们知道么?..讯飞出 PC 版了.
    fansangg
        17
    fansangg  
       2020-11-08 23:30:57 +08:00 via Android
    @eggcn 你这个我是很赞同的,确实有很多人就是喜欢折腾,喜欢和大众用不一样的东西
    imn1
        18
    imn1  
       2020-11-09 01:38:56 +08:00
    @spaceman #13
    基本上就改一两个 UI 的文件,其他的全部 copy 过去就行了
    我一套方案配了 windows/linux/android 三个系统,只是 UI 不同而已

    Rime 只是玩拼音没意思,比不上那些联网的输入法词库新
    想象一下键位对应字符( Rime 的主旨),就很多东西可以玩了,我做了一个英汉翻译,一个自己理解的 unicode emoji,一个韩文字形输入……还做了一个密码输入,当然只是玩一下,完全明文毫无安全可言
    我还在想可不可以做命令速查、某些数据库速查什么的,开一下脑洞,好玩东西多的是

    因为配置都是 yaml,写些脚本随时更新,便签、备忘录什么都可以玩,按几个建就出来了
    只是可惜 Rime 不支持脚本,不然更好玩
    flavoury
        19
    flavoury  
       2020-11-09 02:31:46 +08:00 via iPhone
    @imn1 支持简单的 lua,如输出日期,定义简单的 filter 等等
    @Kagari 可以看我以前发过的帖子
    MrGba2z
        20
    MrGba2z  
       2020-11-09 06:43:42 +08:00   ❤️ 1
    能转存个 google drive 之类的么 分享满了要注册才能下
    wy7305e
        21
    wy7305e  
       2020-11-09 08:09:20 +08:00 via Android
    fcitx 不是有 cloudpinyin 吗
    gugugagadun
        22
    gugugagadun  
       2020-11-09 08:18:26 +08:00
    感谢楼主!
    tg3253
        23
    tg3253  
       2020-11-09 09:24:52 +08:00
    不知道能不能导入到 windows 自带输入法中?如果能的话请转存 Google D
    osmnx
        24
    osmnx  
       2020-11-09 09:38:06 +08:00 via iPhone
    感谢楼主
    ronman
        25
    ronman  
       2020-11-09 09:56:05 +08:00
    辛苦了,感谢楼主,提示一下,深蓝最新版已经可以支持转换为 Gboard 词库
    SM2U
        26
    SM2U  
       2020-11-09 10:58:23 +08:00
    由于 rime 无法像搜狗输入法一样摁一个快捷键直接跳转到『单字』,如果词库太大,并且不是自己培养的话,那么会出现打一个词组,然后翻页选词,会让你抓狂的,你要跳转到『单字』,可能要有耐心,不停地摁翻页键。所以,词库太大,反而会影响到输入效率。
    作者佛振也说过类似的:“词库最好还是自己培养,或者从其他输入法导入自己的词库”。
    SM2U
        27
    SM2U  
       2020-11-09 11:00:24 +08:00
    @SM2U 各位,如何解决这个问题?我也知道词库大有大的好处,但如何解决『快速跳转到单字』这个问题?谢谢各位。
    imn1
        28
    imn1  
       2020-11-09 12:00:12 +08:00   ❤️ 1
    @SM2U #27
    不知道你那边怎么配置,我这里双拼,用左右键在拼音中移动光标(不是翻页),是可以跳到单字的
    例如 dodode (全拼 duo'duo'de ),按左键回到第一个 o 时,就出现 duo 拼音的单字了,到第二个 o 则是 duo'duo 的词

    |表示光标 --> 候选
    d|odode --> d 声母开头单字
    do|dode --> duo 拼音单字
    dod|ode --> duo+第二个字 d 声母的词
    dodo|de --> duo duo 的词


    但你说的#26 的问题是存在的,候选词太多的话,不好使。如楼上所说,Rime 是 old school 方式的输入法(按键匹配),它本身没有算法,不像现代输入法那样可以自动调整、测算最佳的候选字、词权重排序

    我个人并没有添加搜狗词库,旧的那个也没用,我聊天不多,打汉字更多是写文章,文章用词不能太随意,太多网络词反而不好,我添加的是地名、科技等专业词库,这些我倒是怕逐个单字选会弄错
    Mavious
        29
    Mavious  
       2020-11-09 12:40:07 +08:00 via iPhone
    @NOspy 我一直在用讯飞 pc 版,不是几百年不更新了吗
    AX5N
        30
    AX5N  
       2020-11-09 13:02:10 +08:00
    不支持云候选的输入法都是垃圾。即便搜狗是个超级大流氓,也比这种单机输入法强 100 万倍。
    SM2U
        31
    SM2U  
       2020-11-09 13:12:58 +08:00
    @imn1 太感谢了!移动左右箭头的确可快速跳到单字。我就没有想到过这个方法:)
    我用的情景是这样的,例如:
    1.我要打出“店子”这个词,我摁“dmzi”,在没有导入搜狗词典的情况下,翻到第二页(每页 7 个候选词),即可找到“店子”。
    2.如果我导入了大量的词典后,我再摁“dmzi”,要找到“店子”这个词怕是要翻到第七页之后,但当我摁到第五页的时候就已经失去耐心了,然后摁『←』,先打出“店”,然后再打出“子”。
    3.这种方法其实就是搜狗拼音的『跳到单字』的快捷键!
    万分感谢您的提醒。但是,您建议要导入楼主这么大的词库吗?谢谢。
    imn1
        32
    imn1  
       2020-11-09 13:35:38 +08:00   ❤️ 1
    @SM2U #31
    输入法是比较个人的东西,例如我的 Rime 配置给别人没法用,我按自己习惯改了键位
    所以是否要导入,还是个人选择吧

    我每天花在 SNS 上面的时间累计不到 30 分钟,我基本 pass 什么云输入,新词,用在搜索打的字比聊天更多
    但我还是需要一些专业词汇的,就算是念化学的,打个“苯硝基二胺”还是怕打错
    miaomiao888
        33
    miaomiao888  
       2020-11-09 13:56:43 +08:00
    可是看到这网盘就没了下载欲望...
    SM2U
        34
    SM2U  
       2020-11-09 13:57:27 +08:00
    @imn1 明白了。万分感谢您的帮助!谢谢。
    hxse
        35
    hxse  
       2020-11-09 14:47:19 +08:00
    @eggcn #15
    "rime 是老掉牙的小推车, 搜狗拼音才是最新劳斯莱斯"
    请问上述发言是你认认真真的用脑子想出来的吗
    maniaccn
        36
    maniaccn  
    OP
       2020-11-09 22:25:18 +08:00
    @miaomiao888 我要是发百度网盘,你更没欲望了。。。天翼云还是相对靠谱的
    archiskijv
        37
    archiskijv  
       2020-11-11 15:38:32 +08:00
    感谢楼主
    mogging
        38
    mogging  
       2021-05-05 11:16:29 +08:00
    如何批量导入啊?下载了搜狗离线版输入法,想导入词库发现只能一个一个来,这就太痛苦了。注册表里面有 "C:\Program Files (x86)\SogouInput\SogouExe\SogouExe.exe" "C:\Program Files (x86)\SogouInput\9.7.0.3695\SGTool.exe" -line 0 -border --appid=scdreg -list %1 但是用这个命令导入会弹提示,写的跑批脚本没法成功进行批量导入。请懂行的各位支招。
    fankz
        39
    fankz  
       2021-10-19 15:23:48 +08:00
    感谢,一直在找怎么导入,能不能发个步骤
    lzg2022
        40
    lzg2022  
       2022-05-13 11:02:40 +08:00
    感谢,辛苦,自己整理得花太多时间吧
    singarpore1988
        41
    singarpore1988  
       2022-09-26 11:52:01 +08:00
    整个词库的 txt 文件大小有 300 多 m 。
    那么问题来了,如果把所有的 txt 都无脑导入,谷歌输入法速度会不会变卡?
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   941 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 80ms · UTC 21:05 · PVG 05:05 · LAX 13:05 · JFK 16:05
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.