PHP 百度知识图谱数据处理与接入SDK
阿里云国内75折 回扣 微信号:monov8 |
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6 |
前言
最近的项目在做百度知识图谱相关的需要实现内容将本地数据处理->数据格式转化->数据接入图谱平台。因为百度提供的sdk为Python的sdk所以我需要将Python程序转换成PHP格式。
图谱生产流程介绍
1.知识定义
建立相应的scheme确定类目以及类目属性
2.数据处理
根据schema中制定好的的数据字段收集符合要求的标准化格式数据1需要根据给定schema收集数据要确保收集的数据字段名称跟schema中的名称保持⼀致2需要将excel数据转换为图谱⽣产平台可理解的JsonLD格式
3.数据接⼊
数据处理好之后需要将处理好的数据推送到知识图谱⽣产平台
4.图谱生产。
生产使用SDK
1.PHP百度图谱数据SDK
2.SDK包含内容
1该sdk包含2.数据处理 步骤 2将excel整理数据转成JsonLD格式
2包含步骤3.数据接入将处理好的数据push到图谱生产平台
3.注意事项
1注意修改sdk的相关配置例如Excel文件路径push的地址处理数据的格式处理等要根据自己项目需求稍做调整
2push数据要用cmd进入到push.php 所在目录通过命令行操作push如果数据量较大通过浏览器执行会又卡死现象
3因项目需要读取excel数据程序中使用PhpOffice\PhpSpreadsheet扩展所以请自行composer安装下载PhpOffice\PhpSpreadsheet扩展
4生成json文件后要对数据简单进行检查主要检查有关联的类目存储值格式是否正确。
总结
祝大家新年快乐~新的一年诸事顺遂称心如意~