循环是Python里写得最多的结构,但大多数人写来写去就是for x in list加range(len())。那些能省掉嵌套、避免flag变量、让循环自解释的技巧,往往用到的时候才后悔没早点知道。 循环是Python里写得最多的结构,但大多数人写来写去就是for x in list加range(len())。那些能 ...
本文介绍如何构建一套文本聚类流水线,将大语言模型嵌入与基于密度的聚类算法 HDBSCAN 相结合,在无标注文本数据中自动发现主题。 当前的生成式 AI热潮,表面上似乎主要集中在聊天界面与提示词工程,但大语言模型(LLM)的实际应用范围远不止于此。