全球主机交流论坛

标题: 敏感词过滤有什么开源解决方案吗? [打印本页]

作者: xiaocai    时间: 2024-4-21 23:33
标题: 敏感词过滤有什么开源解决方案吗?
公司最近想做个项目,需要做敏感词 敏感图片过滤, 我以为这种行业通用的东西肯定有开源解决方案了,就告诉需求说应该问题不大,容我去调研调研。。。谁知道一调研。。居然没啥靠谱的开源解决方案,现在大模型这么火,以为肯定有啥开源大模型能解决这个问题,谁知道 也没有人去搞这个方向。。商业的就看到:https://dun.163.com/trial/text 网易这个方案似乎做的还行。 但是公司的数据不想吐给别的公司的话,自己私有化似乎没啥好的方案?? 难道要自己去搞素材跑一个模型出来吗?
作者: solomon    时间: 2024-4-21 23:53
这个是TC特色,除了一些敏感人名外,其他的都是各个平台定的敏感词
作者: ccnif    时间: 2024-4-21 23:54
找区所属网安支队一般都会敏感词表的
图片鉴别基本就是收费的了
作者: Prk    时间: 2024-4-21 23:56
GitHub 上有个 Java 的平台敏感词过滤系统,我用过

公司内部用的不是,也不开源,不对外公布,你用这个就够了

https://github.com/houbb/sensitive-word
作者: 机长    时间: 2024-4-22 00:00
可以参考这个  我目前在用 /thread-1177169-1-1.html

作者: shelizi1    时间: 2024-4-22 11:09
有卖这种专用违法字词 未北岸 **图片拦截的系统,自己要做的话,我这里有买一套研究研究去?
作者: 无分人    时间: 2024-4-22 11:12
图片审核:https://github.com/arnidan/nsfw-api
作者: acpp    时间: 2024-4-22 11:13
没必要智能化吧,弄个本地词库,紧跟时事更新就行了。




欢迎光临 全球主机交流论坛 (https://sunk.eu.org/) Powered by Discuz! X3.4