必备条件:
熟悉Python及常用的数据处理相关工具库(如Pandas, NumPy, datasets),了解doc/docx/pdf格式解析。
具备数据处理、ETL流程开发与管理经验。
了解Milvus/Pinecone等向量数据库及相关技术者优先。
优先条件:
无
岗位职责:
"职位描述:
负责文书知识库的构建,包括word/pdf等格式文稿数据的抽取、清洗、处理、向量化与入库等;
基于自动或半自动方法进行数据标注,为LLM训练调优提供高质量数据支持。
职位要求:
熟悉Python及常用的数据处理相关工具库(如Pandas, NumPy, datasets),了解doc/docx/pdf格式解析。
具备数据处理、ETL流程开发与管理经验。
了解Milvus/Pinecone等向量数据库及相关技术者优先。
加分项:
有大模型数据处理经验者优先"
任职要求:
熟悉Python及常用的数据处理相关工具库(如Pandas, NumPy, datasets),了解doc/docx/pdf格式解析。
具备数据处理、ETL流程开发与管理经验。
了解Milvus/Pinecone等向量数据库及相关技术者优先。