目录

  • 1. 自动评论机器人
    • 1.1 [Blink动态](https://blink.csdn.net/)
    • 1.2 博客评论
    • 1.3 [极客日报](https://bbs.csdn.net/forums/csdnnews)社区
  • 2. 热榜/个性化推荐
    • 1.1 热榜
    • 1.2 个性化推荐
  • 3. 技能树
  • 4. 机器学历分类
  • 5. 博客难度等级分类
  • 6. 其他工作
  • 7. 总结

团队博客: CSDN AI小组


光阴似箭,日月如梭,一年的工作转瞬又将成为历史,2022年即将过去,2023年即将来临。新的一年意味着新的起点、新的机遇、新的挑战、“决心再接再厉,更上一层楼”。为了2023年更好地完成工作,扬长避短,现总结如下:

1. 自动评论机器人

自动评论机器人 (没错,就是 programmer_ada) 主要用于减轻人工的工作,并增加 CSDN 各个业务的活跃度,当前主要在 Blink 动态、博客评论、极客日报社区 进行自动评论。大致的策略如下:

1.1 Blink动态

Blink 类似于 CSDN 用户的朋友圈,用户可能发各种各样的帖子,我们首先识别用户的意图(例如:学习、提问、分享等),然后再根据意图选择合适的回答模版对用户进行评论。

1.2 博客评论

  • 对首发博客的用户进行鼓励。
  • 对入选极客日报社区【CSDN 每天最佳新人】的博客进行鼓励。
  • 对新用户的前4篇博客内容进行相关领域的提问、鼓励以及建议。
  • 其他若干策略,这里不一一列出。

1.3 极客日报社区

  • 对 “每天值得看”、“一周精选”、“月度精选” 榜单中上榜用户的评论进行回复,回复的内容是该用户可能感兴趣的问题。

  • 对 “每日分享能手”、“一周铁粉增长”、“持续学习” 榜单中上榜用户的评论进行回复,主要是鼓励性质的回复。

2. 热榜/个性化推荐

1.1 热榜

今年接手了热榜的数据推荐流,在文章的质量、文章的前沿性、行为分计算等多个维度进行了改进和优化,力求让真正“热”的文章上热榜。具体的更新内容请参见这篇文章。

1.2 个性化推荐

个性化推荐流是年底才接手的,所以改进点有限,具体更新内容如下,主要为了提升推荐流数据的质量:

  • 过滤掉低质量分、标题党、软文、封面违规的博客数据;
  • 过滤掉禁言用户、培训个人/培训机构/机器人/测试账号用户对应的数据。

3. 技能树

技能树的基本框架和流程在2021年已经完成,2022年主要对技能树的内容和功能进行升级,具体如下:

  • 负责 12 棵技能树的上线工作,其中技能树的习题和结构由专家用户提供,我主要负责上线、参考资料、课程资料等的支持,包括:neo4j 技能树、云原生技能树、网络技能树、CUDA入门技能树、Vue入门技能树、MySQL入门技能树、MySQL进阶技能树、小程序技能树、Go技能树、Git技能树、Markdown技能树、Linux技能树。

  • 新增职业路线

  • 新增技能树相关榜单。

  • 练习题选项差异比对,使用户更便捷地找出选项之间的差异。

  • 新增【速查手册】频道,并整理与发布了12个高质量速查手册帖子;

  • 新增技能树收费功能。

  • 技能树知识点的【付费专栏】频道新增付费课程内容,覆盖率约75%;

  • 技能树企业微信机器人监控预警,每天定时对技能树的一些异常进行报警,保证能够及时对异常问题进行修复。

  • CSDN编程比赛 题目数据流接入并适配技能树管道,使用技能树的更新逻辑对比赛题目数据进行更新。

  • 技能树参考资料的优化。

  • 技能树匹配接口的优化(博客、问答)。

4. 机器学历分类

用户的学历类别是用户画像中用户的一个重要特征,基于该特征可以更好地服务用户,例如:推荐合适的内容给用户等。当前的学历类别主要分为以下8个类别:大学前、大一、大二、大三、大四、研究生、工作(三年内)、工作(三年以上)

分类的具体实施流程如下:

  • 构建机器学历分类模型,并进行多轮优化,效果acc提升:59.63% --> 76.48%。在限制置信度阈值为60时,acc可达85.50%;
  • 共清洗2670万有效用户,其中半年内活跃用户覆盖率达99%以上;
  • 拉通机器学历增量数据清洗管道,每天定时清洗增量用户。

5. 博客难度等级分类

CSDN 每天都会产生数以万计的博客数据,但是这些数据没有难度等级的体系结构,这种体系结构在 个性化推荐、用户画像、榜单 等业务上都有很大的作用和价值。具体细节可参见这篇博客

6. 其他工作

  • 博客摘要优化与上线

  • 质量分统一接口上线(博客、问答、文库、学院、社区)

  • 全站统一标签的入库与自动化更新,标签相关的接口

  • 文库摘要 (规则+TextRank)、文库标题生成 (PreSumm+规则)

7. 总结

2022年做了很多有意思的工作,主要分类3类:1) 有的上线了,效果达到预期,并且吸引了很多用户;2) 有的上线了,但是效果却没达到预期;3) 有的上线了,但是却没有实际落地。

2023年需要继续努力,针对上述的第 2) 点进行优化,针对第 3) 点分析原因为什么没有落地,改进后续的工作。此外,希望使用 AI 技术,做出更多有意思的功能和模块,提升 CSDN 内容的质量和用户体验。

最后,祝大家新年快乐,万事如意!

2022 个人工作年度总结相关推荐

  1. “名师带教,共同成长“渭南市马红“名师+”研修共同体2022年工作计划

    名师带教,共同成长 富平县马红"名师+"研修共同体 2022年工作计划 富平县杜村小学   马 红 (2022.3-2022.12) 为了充分发挥名师示范.辐射.引领.带动作用,培 ...

  2. 2022刘润年度演讲:进化的力量关键词

    2022刘润年度演讲:进化的力量关键词 1.风险决策=概率 X 代价 2.真正的不确定性无法计算概率 3.2022年第一批00后毕业,总人数1076万,增长了18.4%:考研人数457万,增长21.2 ...

  3. 2022稳定学习年度研究进展系列报告丨精华观点总结

    近年来,在独立分布假设的前提下,机器学习模型的表现越来越好.但在实际应用场景中,数据本身却具有很强的异质性和差异性,这就对模型的泛化能力产生了较高的要求.为了解决分布外泛化问题,稳定学习应运而生.12 ...

  4. 计算机老师工作年度总结,计算机老师年终工作总结3篇

    计算机老师年终工作总结3篇 总结是指社会团体.企业单位和个人在自身的某一时期.某一项目或某些工作告一段落或者全部完成后进行回顾检查.分析评价,从而肯定成绩,得到经验,找出差距,得出教训和一些规律性认识 ...

  5. 年终工作总结该怎么写?2022年终工作总结PPT模板,这样写老板才喜欢

    你会写年终工作总结吗?每到年底的时候作为公司的管理层就要向老板汇报这一年的成果,做得好不好.赚没赚钱.有什么成果,这些都是要汇报的重点. 要是你汇报的不好,那老板就会觉得你没有这个能力,轻者年终奖没了 ...

  6. 2022 找工作!我建了一个AI算法岗求职群

    点击下方卡片,关注"CVer"公众号 AI/CV重磅干货,第一时间送达 大家好,我是Amusi!2022 春招(面向2022届补招)和 2022春季/暑期实习(面向2023届)已经 ...

  7. 车道线检测2022新工作整理,2D、3D都有

    车道线检测是自动驾驶中一项基础而重要的任务,学术和工业界一直投入了大量的工作.小汤也一直对车道线检测任务感兴趣,并在公司开发过相关功能.也分享过一些相关的文章: 相关链接(点击进入): 车道线检测综述 ...

  8. 2022年终工作总结PPT模板来了~

    2022年年终总做总结该怎么写呢?都应该包括哪些内容呢?从下面这个PPT模板中或许我们可以窥得一二,一起来看看吧~ 希望能帮到大家!

  9. 2022 找工作复盘

    为何辞职 个人规划.年满30,期望自己在管理能力上有所提升.目前的小组虽然对于一个程序员技术能力提升帮助很大,但是缺少锻炼管理能力的机会(想带新人.想去负责一个多人合作完成的项目). 经济压力.疫情背 ...

最新文章

  1. 性能优化之Java(Android)代码优化
  2. 聊聊jump consistent hash
  3. 运行一个程序时如何打印出执行程序的时间
  4. ubuntu12.04升级后找不到共享目录
  5. 浅谈前端路由原理hash和history
  6. 四五六年级计算机教学计划,五六年级信息技术教学计划
  7. Android11MIUI12,安卓11版MIUI12来了,3款已适配
  8. linux进程增删改查,iptables的增删改查
  9. 入行二十年的一些认知
  10. Lanecat网猫案例小议
  11. Cisco网络管理的35个常见问题及解答
  12. winhex恢复误GHOST系统造成的数据丢失
  13. 2019强网杯upload
  14. 【思特奇杯·云上蓝桥-算法集训营】第1周----真题汇总+思路分析
  15. uni-app的初步了解
  16. truffle init error,unbox Downloading报错问题
  17. 「群体遗传学实战」第三课: 如何对SNP位点进行过滤
  18. java dao 是什么_dao java是什么
  19. matlab脚本文件求梯度,转:用MATLAB求梯度的二个实例
  20. 一直在学习,一直在忙碌,突然停下头来干事情,又突然地发现什么都忘了(记录忙忙碌碌的研究生生活)

热门文章

  1. twemproxy源码解析-前言:特性简介
  2. Redis 的分片集群搭建-代理方式(twemproxy)
  3. C#练习题答案: 猫年,狗年【难度:0级】--景越C#经典编程题库,1000道C#基础练习题等你来挑战
  4. 【项目管理】对管理的认识与思考
  5. Quadro P4000显卡 win7系统安装3dmax2018无法正常打开
  6. 引导图(MaterialIntroView)
  7. 十二、Event Listener
  8. AFLNET源码理解(二)
  9. MySQL5.5安装教程
  10. Anaconda 中使用 You Get