2022年团队终结,2023年展望
2022年终总结
今年团队收获颇丰,硕果累累。投入产出比和技能储备都有了很大的进步。团队数量扩大到15人(另外4名实习生),我们团队今年完成了jira。 942 另一个需求是在线编程,完成数据脚本业务在线生产 709 数据部总共提出了个人需求 941 (包括被拒绝的需求)。2022年开发了两款全新产品(DDP,ADP),共有五种核心产品(SDP,CDP,LDP,IMDP,DDS)在生产环境中运行,七个平台在我们的公共账户上有相关的技术共享文章。通过大屏幕监控程序,在线运行脚本累计生产脚本1940个,日均脚本运行 50万 二、剧本日均可靠性:98.7828%,异常的主要原因是脚本超时执行(网络抖动、SQL慢查询等)。),机房服务器扩展到65+台湾,相关生产服务多达数百项,服务监控全面纳入钉钉提醒。
今年开发的Vscode插件用于使用CDP,支持脚本编写单步调试,解决了SDP平台脚本无法单步调试的痛点(感谢团队陈**研究成果),利用VSCode强大的IDE功能使脚本编写更容易、更智能*在努力下,后台调度系统也全面支持分布式部署,如下图所示:
还可以在debug输出中查看返回的数据,使对象结构更加直观:
今年还开发了微信/企业微信/QQ在客户端破解IMDP系统,汇编逆向工程,xposed为了方便做一些技术储备,该平台为客户提供了二次开发收发聊天信息的渠道(使用平台js脚本),可以根据需要增减脚本的扩展函数。目前支持函数可参考在线文档:https://wstest.idbhost.com/apiqq/#/
今年生产增加了大量的分析模型,为非结构化数据分析积累了丰富的经验,在PDF文档分析、微信公共文章分析、图片分析等方面得到了全面的支持,我们升级了文档分析DPM平台,更方便地与SDP无缝连接创建文档分析模型,使用该模型可以轻松地将相关数据提取到业务目标表中,新的DPM平台和数据输入员之间的分工更加明确,权利和责任更加明确。
此外,整个SDP平台还开发了许多亮点功能,待办事宜更好地连接个人和SDP功能点,研究报告和新闻平台也进行了显著升级。在监控方面,数据库存储也发生了结构变化。数据浏览器支持异构数据浏览,支持公司所有存储系统的统一数据提取(使用sqlone语言),自主开发的ss语言可以更快、更简单地处理数据业务。目前,SDP管理超过 几十亿 结构化数据和 数十T 整个系统都是基于文件的分布式,运行稳定,各服务相关负责人也更加明确。
在开源方面,为github贡献了很多代码,微信官方账号也写了近20篇技术原创文章,2023年将继续保持。
幸运的是,今年没有发生重大生产事故,但有一次主数据库停机一个半小时。幸运的是,它发生在周五下午。服务器主板硬件故障无法恢复后,原本从库改为主库,另一个从库的建设在周末完成。幸运的是,在故障期间,客户对新数据没有投诉。
2023年展望
明年,整个SDP系统将继续根据双周会议的需要进行迭代。DDP和两个新平台ADP完成研发,加强CDP整合流程安排,使脚本开发更加进一步便利和智能化学。完成一个软项目申请,完成目前的客户项目。在服务部署方面,让更多的服务支持集装箱部署,15个团队扩大到20个左右。
明年,在线编程将更多地迁移到vscode上。在此之前,将充分考虑新旧脚本的兼容性和新编程平台的可靠性(主运行)。
此外,由于今年项目较多,与宁大合作事宜推荐不顺利,明年将希望在这方面碰撞出更大的火花,ADP该平台集成了更多、更强、更好的人工智能算法。
~~~加油,2023!~~~~
推荐阅读
•基于PaddleNLP模拟一个火出圈ChatGPT•基于VSCode的数据开发平台的设计和实现•微信实时采集和微信机器人的实现•MySQL数据闪回使用binlog进行•NLP — 文本分类和BIO实体标记•异地异构数据同步传输平台的设计与实现•去除各种形状的印章
欢迎关注我的微信官方账号“Sumslack第一时间推送原创技术文章。
