大模型应用

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6

https://github.com/imartinez/privateGPT

1 功能

  • 整体功能想解决什么问题
    搭建完整的 RAG 系统与 FastGPT相比界面比较简单。但是底层支持比较丰富可用于知识库的完全本地部署包含大模型和向量库。适用于保密级别比较高或者完全不想使用收费模型和服务的情况。
  • 当前解决了什么问题哪些问题解决不了
    PrivateGPT 提供了整体转换、入库、存储、匹配、合成答案图形界面的解决方案并提供图形界面用于检索操作。
    RAG 所面对的问题比如不够准确多文档组合生成答案这些问题需要进一步细化工具似乎不能通过架构来解决。另外由于多数本地部署的模型效果与 ChatGPT 差距比较大这里只是看到了本地部署的架构和实现的可能性部署后用户是否能接受其效果还待验证。
  • 提供哪些功能点其中哪些是刚需
    核心功能是通过简单的操作实现对本地文件的检索和问答功能相对单一。
  • 用户使用难度操作逻辑是否过于复杂
    整体工具链使用了poetry构建安装相对方便。但由于包含了深度学习库肯定比一般项目复杂很多安装时间长占空间大。
    Dockerfile如果写得有一点问题频繁更新难免有错就会面临至少部分内容重新下载打包的问题。另外由于可插拔的选项比较多还需要用户进一步设置。

2 技术栈

  • 技术栈是什么
    • PrivateGPT 不是一个用大量代码实现具体功能的项目相反它尽量使用现有工具主要提供架构组织现有方法以实现功能。
  • 现有底层工具消化了哪些常用功能
    • llamaindex 文档的转换和管理
    • pytorch & cuda 本地支持深度学习模型因此image也较大
    • sentence-transformers 文本匹配
    • FastAPI 后端框架
    • Chroma 向量数据库
    • Qdrant 向量数据库
    • Gradio 界面由Gradio实现有效降低了程序的复杂度
    • fern 管理文档
    • 使用 poetry 管理项目
  • 代码分析使用cloc工具统计
    • 代码 3.2M主要为 Python 代码共 2733 行
    • local 版本 image 大小为 6.34Gexternal 版本为 5.68G
    • 核心代码在private_gpt/private_gpt/ 目录下
  • 使用场景
    • 完全本地化的知识库

3 商业模式

相对简单的项目代码主要在架构和调用其它工具依赖 llama-index并实现了扩展如支持几个主流向量数库后面可能接入更多模型和向量库。可作为一种集成的方案或者支持各种组件插拔的 Hub 使用。

4 使用

4.1 安装
  • 下载项目
$ git clone https://github.com/imartinez/privateGPT
$ cd privateGPT
  • 修改配置文件
vi settings.yaml

建议第一次运行时将 llm 设置为 openai整体调通后再使用本地 llm 下载模型否则太过复杂不容易定位问题。

  • 修改 Dockerfile.local我build时报错
RUN addgroup worker
RUN adduser --ingroup worker --system worker
  • 构建 local 环境
$ docker build . -f Dockerfile.local --build-arg HTTP_PROXY=xxx --build-arg HTTPS_PROXY=xxx -t private-gpt
  • 细节请见文档https://docs.privategpt.dev/installation
4.2 运行

如果直接执行失败建议以root用户启动bash进行调试

$ docker run --rm -p 8080:8080 -e OPENAI_API_KEY=xxx -e HTTP_PROXY=xxx -e HTTPS_PROXY=xxx --entrypoint bash -u 0 -it private-gpt
$ .venv/bin/python -m private_gpt

在localhost 8080 端口可打开 gradio 应用

4.3 使用感受

gradio 主要用作 demo实现功能比较简单比如上传文档后无法删除文本切块大小和模型的对应关系需要提前设置。

5 资源

文档
全面了解 PrivateGPT中文技巧和功能实测

阿里云国内75折 回扣 微信号:monov8
阿里云国际,腾讯云国际,低至75折。AWS 93折 免费开户实名账号 代冲值 优惠多多 微信号:monov8 飞机:@monov6