掌握hadoop大数据的基本技术,熟悉使用pyspark技术,学会编写spark RDD程序,学会使用DataFrame,学会使用spark Sql 语句,学会利用spark读取 MySQL 数据库的数据,学会利用 jieba分词框架,学会使用python网络爬虫框架,学会使用pyecharts数据可视化技术,掌握python web框架 ...
auc在传统的机器学习二分类中还是很能打的,但是有一种场景,虽然是分类模型,但是却不适用auc,即广告推荐领域。 推荐领域使用的CTR(点击率)来作为最终的商用指标,但是在训练推荐模型时,却不用这个指标,用的是GAUC。 原因是推荐模型目前比较成熟的 ...
在我们的“文档处理 Agent”项目中,基础的问答功能(RAG)已经解决得很好。但随着用户需求升级,我们面临了新的挑战: 用户场景: “这是 2024 和 2025 年的两份经营数据报表,请对比 DAU 和营收的同比增长率,并生成一个 Excel 表格给我。另外,把总结报告 ...