这篇文章把 Streamlit 最常用的三块内容串了一遍:多页面怎么组织、数据库怎么连、文件怎么处理。 streamlit 这几年在数据科学圈子里火得很快。不用学前端,不用折腾路由,纯 Python 就能把数据分析脚本变成像模像样的 Web 应用。但真要拿它做点正事 —— 比如搭 ...
本文介绍如何构建一套文本聚类流水线,将大语言模型嵌入与基于密度的聚类算法 HDBSCAN 相结合,在无标注文本数据中自动发现主题。 当前的生成式 AI热潮,表面上似乎主要集中在聊天界面与提示词工程,但大语言模型(LLM)的实际应用范围远不止于此。