搜狗输入法Mac版如何导入自定义细胞词库?

功能定位:为什么要自己导词库
在 Mac 上使用搜狗输入法时,「细胞词库」是官方对「小型自定义词库」的统称,作用相当于给输入法临时加装一本「专业词典」。与云端大词库不同,细胞词库完全本地生效,既能在离线状态调用,也不会把敏感词同步到服务器,因此被政府、医疗、金融等内网场景广泛使用。
2026 版搜狗输入法 macOS 客户端继续保留「本地细胞词库」入口,但把入口藏进了「设置-词库管理-高级」三级菜单;同时强化了词库格式校验,旧版「.scel」必须转码为「.bcel」才能导入。本文基于截至当前的最新版本演示完整链路,并给出失败回退方案。
先确认版本差异与兼容性
经验性观察:2026 年 4 月后发布的 macOS 安装包已取消对 10.13 以下系统的支持,且只提供 64 位二进制。如果你的 Mac 停留在 macOS 10.12,导入按钮会直接灰显,提示「系统版本过低」。解决方法是先升级系统或改用 Windows 端导入后再通过「跨端同步」拉回 Mac,但跨端同步需要登录同一搜狗账号并开启「词库漫游」。
格式演进一览
| 年份 | 扩展名 | 是否需转换 | 备注 |
|---|---|---|---|
| 2020 及以前 | .scel | × | 直接导入 |
| 2022-2025 | .scel/.bcel | △ | 弹窗提示转换 |
| 2026 至今 | .bcel | √ | 必须转换,否则报错「格式不符」 |
准备材料:拿到合规词库文件
1. 来源:优先使用单位内部术语表、公开标准或自己维护的 Excel,严禁直接搬运付费词库,避免版权争议。
2. 格式:每行「词语+Tab+权重+Tab+词性」,权重区间 1–10,词性用两个字母缩写(n 名词、v 动词…)。示例:
ESG报告 8 n
3. 用官方「细胞词库生成器」(Windows 版附带)导出为 .bcel;Mac 端目前无生成器,只能导入。
操作路径:三分钟导入流程
步骤 1:打开隐藏入口
屏幕顶部菜单栏点击「搜狗输入法图标」→「偏好设置…」→「词库」标签页→右下角「高级」→「导入细胞词库」。如果按钮灰色,请检查是否开启「本地模式」,本地模式下需先关闭「隐私级本地模式」才能导入外部词库。
步骤 2:选择文件并二次校验
在弹出的 Finder 窗口选中 .bcel 文件,点击「打开」。此时会弹出「词条预览」小窗,显示前 20 条高频词。若出现乱码,说明编码非 UTF-8,需回 Windows 重新生成。
步骤 3:立即生效与延迟生效场景
导入成功后会提示「已添加 ×× 条词条」。经验性观察:在备忘录、TextEdit 这类原生 App 里可立即打出新词;而在部分 Electron 客户端(如 Slack 国内版)需要重启该 App 才能读入最新词库,原因是 Electron 进程缓存了旧的输入法状态。
常见失败分支与回退
- 提示「导入 0 条」:权重值超出 1–10 范围,或词性拼写错误,检查生成器设置。
- 提示「文件损坏」:把 .bcel 用 ZIP 工具打开,看内部是否缺少 dict.info,如缺失则重新导出。
- 想撤销:「高级」→「管理细胞词库」→选中后点击「移除」,重启输入法即恢复默认状态。
与云端词库混用时的优先级
搜狗官方说明:本地细胞词库 > 云端大词库 > 默认词库。也就是说,当「碳足迹」同时存在于细胞词库与云端词库时,细胞词库里的权重高者胜出。若你担心本地词库覆盖云端更全的更新,可在「高级」里取消「细胞词库生效」复选框,仅保留云端结果。
跨端同步:Windows 做好后如何到 Mac
- Windows 端登录搜狗账号,导入并确认生效。
- 右键状态栏图标→「同步词库」→勾选「细胞词库」。
- Mac 端登录同一账号,顶部图标→「立即同步」。经验性观察:首次同步需数十秒,之后增量更新在数秒内完成。
不适用场景与风险控制
1. 词条超过 50 万条会导致输入法启动变慢,经验性观察冷启动时间从 2 秒级延长到 10 秒级;建议把超大词库拆分为多个场景包,按需启用。
2. 涉及个人隐私的敏感词(如内部员工姓名拼音)请用本地加密盘存储 .bcel 源文件,避免随 Git 公开。
3. 政府内网电脑若已安装「麒麟/统信」定制版搜狗,需确认管理员策略未禁用「导入外部词库」功能;如被禁用,按钮会直接隐藏,而非灰色。
验证与观测方法
1. 打开「控制台」App,左侧选择「日志」→ 筛选「SogouInput」,可看到「LoadLocalCellDict: xxx.bcel, count=1234」字样,确认词条数量。
2. 在任意文本框输入新词首字母,若候选栏立即出现该词且右侧有「☆」标志,说明细胞词库已生效。
最佳实践清单(可打印)
决策前
- 确认系统 ≥ macOS 10.13
- 词库源合法且 ≤ 10 万条
- 文件已转码为 UTF-8 的 .bcel
导入中
- 先关闭「隐私级本地模式」
- 预览窗口检查乱码
- 导入后重启 Electron 类 App
导入后
- 控制台日志核对词条数
- 用「☆」标记验证候选词
- 定期用「管理细胞词库」清理不再使用的包
FAQ:导入细胞词库常见疑问
Mac 端能否直接生成 .bcel?
截至当前的最新版本,Mac 端仅支持导入,生成器仍仅限 Windows 版附带工具。
导入后想恢复默认怎么办?
进入「高级-管理细胞词库」,选中对应文件点「移除」,重启输入法即可。
词条上限多少合适?
经验性观察,单包 ≤ 5 万条可保持秒级启动;超过 10 万条冷启动明显变慢,建议拆包。
收尾:下一步行动建议
如果你已经按本文完成导入,不妨立即打开常用写作软件,输入几个新造词验证是否秒出;若公司术语更新频繁,建议把「生成 .bcel」加入季度维护流程,由 Windows 同事统一转码后通过 Git LFS 分发,Mac 同事直接拉取同步即可。最后,记得定期清理过期细胞词库,让输入法保持轻量,才能把 2026 版「知意 3.0」大模型的算力留给真正需要整句预测的场景。


