V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX  ›  SZhan  ›  全部回复第 3 页 / 共 5 页
回复总数  100
1  2  3  4  5  
2023-09-26 14:08:41 +08:00
回复了 SZhan 创建的主题 Java 如何从一段自然语言中识别地址信息?
@mmdsun 这个是不行的,服务器通外网被审计了,需要发工单。正常 curl 百度之类的会提示无访问权限,通一个网址要一步步工单申请,走政府领导签字审批
2023-09-26 11:36:46 +08:00
回复了 SZhan 创建的主题 Java 如何从一段自然语言中识别地址信息?
@season8 分词的我做过一个类似的实验,把内容分完,如果匹配识别区、街道、社区是没问题的,但是具体的地点,可能一个地点会被拆成零零散散的几个字,也可能是一个完整的地点,那么完整的地点可能就会识别成功,但是被拆成字的话,有的就会直接就会返回一个跟内容里完全不相关的兴趣点,就是兴趣点太多太杂了。
2023-09-26 11:28:31 +08:00
回复了 SZhan 创建的主题 Java 如何从一段自然语言中识别地址信息?
@lscho 那您是直接把小区的数据丢进去直接匹配么?我这个是全市的,除了小区还有各种基础设施、商业综合体、超市乱七八糟什么的,是给城管用,总共也几十万个兴趣点吧
2023-09-26 11:25:12 +08:00
回复了 SZhan 创建的主题 Java 如何从一段自然语言中识别地址信息?
@zjuster #90 大佬说的对,其实不管怎么样,哪怕前期开发实现了,后期维护也是一个痛点!他们想要的是纯机器,不人工介入。人工修改的界面都给他们开发好了,然后他们不想投入人去做。然后我们销售售前只管 tmd 接项目,项目中标,开发入场,他们就啥事不管了,继续去找下一个项目踩雷去了,目前就是这样,从一个坑项目到另一个坑项目循环。
2023-09-26 11:16:40 +08:00
回复了 SZhan 创建的主题 Java 如何从一段自然语言中识别地址信息?
@liuzhedash
@keepRun #68 两位好,我想到一个问题,我之前也有做过一个测试,我没有用一个一个字从头匹配。我是把一段话,首先进行清洗,把内容中已经有明显的提到区、街道、社区的提取出来,然后使用 jieba 分词 java 版,把分词后的 list 去和 poi list 匹配。这时候分为两种情况:1 、如果第一步清洗的时候已经有了结果,poi 列表就可以缩小了,只需要把对应区的 poi 来字符串匹配 2 、如果没有任何清洗结果,那就全量的 poi 直接丢进来字符串匹配
不过,设想是好的,但就存在一个问题,poi 里数据虽然多,但是经常抓不到正确的数据,因为分词过后打散的词比如在前两个“服务”、“好”什么的词就能在 poi 库里抓到,但是人家确实是个 poi ,就很绝 https://i.imgur.com/f8DzIWo.png
2023-09-26 10:50:14 +08:00
回复了 SZhan 创建的主题 Java 如何从一段自然语言中识别地址信息?
@lrzsw2008 是的 人工审核的界面开发了 然后他们说人工的事干了 要你们开发干什么
2023-09-26 10:46:36 +08:00
回复了 SZhan 创建的主题 Java 如何从一段自然语言中识别地址信息?
@liuzhedash
@keepRun #66 没事没事,大家都是探讨问题,您不要生气哈,AI 的话确实肯定是耗资源,我会去和甲方领导提出的。然后我目前能做到的就是已经有区、县、街道、社区 明显字眼的匹配到,但是对于后面的地点就抓不到,我参考下您之前发的那个学习一下
2023-09-26 10:40:30 +08:00
回复了 SZhan 创建的主题 Java 如何从一段自然语言中识别地址信息?
@pengtdyd 希望一点小小拙见能帮到您理解,如果有讲的不对的,各位评论区大佬随时指出
2023-09-26 10:39:34 +08:00
回复了 SZhan 创建的主题 Java 如何从一段自然语言中识别地址信息?
@pengtdyd lbs 之前有接触过,定位位置服务吧,这个应该好理解一点,然后 NER 中文对应的就是命名实体识别,从一段话中抓取出一些不同领域的词,像我这种就是,从一段话中抓取出具体地址,就是 NER 干的活,然后我需要 LBS 服务去根据识别到的地址获取具体的位置(经纬度)或者所属信息(区、街道、社区)
2023-09-26 10:34:54 +08:00
回复了 SZhan 创建的主题 Java 如何从一段自然语言中识别地址信息?
@kingfalse 这价格,,,也是没谁了,后面还是继续这么弄得么?
2023-09-26 10:33:05 +08:00
回复了 SZhan 创建的主题 Java 如何从一段自然语言中识别地址信息?
@svipchao 不是这样的哦,数据来源是这样的,我们不直接和这个工单受理平台对接,是它受理平台推给一个数据中心,然后数据中心通过库表推送的方式给到我们的,不涉及 ip 的哈,所以只有这个内容作为依据去分析
2023-09-26 10:30:10 +08:00
回复了 SZhan 创建的主题 Java 如何从一段自然语言中识别地址信息?
@keepRun #61 感谢感谢!我看下,因为我是做 java 开发的,想通过 Java 的方式去解决,所以如果让直接上手大模型训练的话要时间精力去琢磨,那是不容易的
2023-09-26 10:27:22 +08:00
回复了 SZhan 创建的主题 Java 如何从一段自然语言中识别地址信息?
@iOCZ #50 这句话也是我一直憋着没法讲出来的 https://i.imgur.com/14cwgsI.png
2023-09-26 10:25:14 +08:00
回复了 SZhan 创建的主题 Java 如何从一段自然语言中识别地址信息?
@codehz 大模型这一块的话 如果要做 那么对接成熟的产品是不太可能了诶 得自己搭建然后训练一个
2023-09-25 14:52:00 +08:00
回复了 SZhan 创建的主题 Java 如何从一段自然语言中识别地址信息?
@lsk569937453 是的,您说的没错,但凡有个需求评估/评审,也不至于在这个鬼需求上耗这么久。但是这整个大的平台,从开发阶段开始以来,都没有评审的过程。
2023-09-25 14:31:05 +08:00
回复了 SZhan 创建的主题 Java 如何从一段自然语言中识别地址信息?
@paopjian 放心好了 不准备推进了 大模型这种除非他们付钱 我们对接
2023-09-25 14:28:09 +08:00
回复了 SZhan 创建的主题 Java 如何从一段自然语言中识别地址信息?
@iridium945 可是现实就是,在现场开发,带头的项目经理也不会去拒绝需求,都是顺着他们。然后汇报的时候稍微提出一点和他们相反的意见,就会面临大量的反驳,以及不好的脸色。就是这样,,,围绕这个识别的问题就说了一个多月。心累...
2023-09-25 14:20:46 +08:00
回复了 SZhan 创建的主题 Java 如何从一段自然语言中识别地址信息?
@theniupa 嗯嗯会说的,这个项目不在规划标书里,是另外提出的,本来说没有钱的,后来拨了点款。
2023-09-25 12:04:00 +08:00
回复了 SZhan 创建的主题 Java 如何从一段自然语言中识别地址信息?
@zjuster #20 是的 我目前往 poi 库匹配这个方向走 就算有匹配上的 也因为脏数据太多 很多都是匹配到一些奇奇怪怪的地址,您看图;然后我们是做市局的项目,虽然是市,但是市内还有很多重复的,比如有的一条路,全市就有 17 条重复的
2023-09-25 11:52:39 +08:00
回复了 SZhan 创建的主题 Java 如何从一段自然语言中识别地址信息?
真的很感谢帖子里各位大佬们提出的建议,这个需求我已经磨了一个多月了,你们敢想象,这个功能所属的项目,才几 w 块。如果说对接 chatgtp 高德 百度这些三方厂家,那钱怕是只能让我自己掏了。其实本身过来咨询各位的意见,是想了解能否仅仅通过我自己去设计、实现这些功能,但是看起来,很难很难。讲真,别碰 zf 项目,一群领导总想教人去做功能,在他们看来,这就是一简单的识别,“为什么这个单子里提到了 xx 小区,你们识别不到呢”,“你们能不能做到它提了某个小区,就可以抓取到他”,“这个识别率怎么那么低”...听了太多,累了... 不忍心去和各位说这样那样的方案不行,我自己可以去继续琢磨琢磨实现,但是用在这个项目上,它不配。再次谢谢各位啦!我一条一条都会好好看的。后续准备去提实现不了,找原数据提供方重新对接吧,做不到就做不到了。
1  2  3  4  5  
关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   2811 人在线   最高记录 6679   ·     Select Language
创意工作者们的社区
World is powered by solitude
VERSION: 3.9.8.5 · 14ms · UTC 13:08 · PVG 21:08 · LAX 05:08 · JFK 08:08
Developed with CodeLauncher
♥ Do have faith in what you're doing.