标准库比你想象的要强大得多——很多时候你以为需要装第三方包的问题,collections、itertools、functools和pathlib已经帮你搞定了。 Python写了几年,总有一些技巧是你偶然发现、然后后悔没早点知道的。它们不是那种"教科书第一章"的基础语法,也不是需要读源码 ...
本文介绍如何构建一套文本聚类流水线,将大语言模型嵌入与基于密度的聚类算法 HDBSCAN 相结合,在无标注文本数据中自动发现主题。 当前的生成式 AI热潮,表面上似乎主要集中在聊天界面与提示词工程,但大语言模型(LLM)的实际应用范围远不止于此。