Logo de AiToolGo

Construa Negócios AIGC de Perguntas e Respostas com Dados Privados Usando o Lindorm AI Engine

Discussão aprofundada
Técnico
 0
 0
 1
Este artigo descreve como usar o Lindorm AI Engine para construir um negócio AIGC de Perguntas e Respostas com dados privados, discute soluções baseadas em recuperação vetorial e Engenharia de Prompt, fornece etapas detalhadas de operação e código de exemplo, com o objetivo de ajudar os usuários a simplificar o processo de desenvolvimento de aplicações de Perguntas e Respostas.
  • pontos principais
  • insights únicos
  • aplicações práticas
  • tópicos-chave
  • insights principais
  • resultados de aprendizagem
  • pontos principais

    • 1
      Discute em profundidade os métodos de construção de Perguntas e Respostas com dados privados
    • 2
      Fornece etapas detalhadas de operação e código de exemplo
    • 3
      Combina as mais recentes tecnologias e práticas de IA
  • insights únicos

    • 1
      Apresenta soluções baseadas em recuperação vetorial e Engenharia de Prompt
    • 2
      Analisa as limitações do método FineTune e as alternativas
  • aplicações práticas

    • O artigo oferece aos usuários etapas e exemplos práticos para ajudá-los a construir rapidamente sistemas de Perguntas e Respostas em aplicações reais.
  • tópicos-chave

    • 1
      Lindorm AI Engine
    • 2
      Perguntas e Respostas com Dados Privados
    • 3
      Recuperação Vetorial e Engenharia de Prompt
  • insights principais

    • 1
      Oferece uma solução completa para simplificar o desenvolvimento de aplicações
    • 2
      Combina vários modelos de IA para melhorar a precisão das Perguntas e Respostas
    • 3
      Guia de operação detalhado e exemplos de código
  • resultados de aprendizagem

    • 1
      Dominar as habilidades para construir sistemas de Perguntas e Respostas usando o Lindorm AI Engine
    • 2
      Compreender a aplicação da recuperação vetorial e da Engenharia de Prompt
    • 3
      Ser capaz de implementar independentemente a construção de Perguntas e Respostas com dados privados
exemplos
tutoriais
exemplos de código
visuais
fundamentos
conteúdo avançado
dicas práticas
melhores práticas

Introdução ao Lindorm AI Engine para Perguntas e Respostas de Conhecimento

O Lindorm AI Engine oferece uma solução completa para construir aplicações AIGC de Perguntas e Respostas com dados privados. Ao integrar o Lindorm AI Engine com capacidades de busca vetorial integradas, os usuários podem facilmente construir funcionalidades de Perguntas e Respostas de conhecimento com uma única instrução SQL, simplificando significativamente o desenvolvimento de aplicações. Isso elimina as complexidades associadas a métodos tradicionais, como o ajuste fino de modelos de linguagem grandes (LLMs) ou o gerenciamento de bancos de dados vetoriais separadamente.

Contexto: Construindo Sistemas de Perguntas e Respostas com Dados Privados

A demanda por sistemas de Perguntas e Respostas com dados privados baseados em Modelos de Linguagem Grandes (LLMs) está crescendo. O objetivo é permitir que LLMs treinados em corpora públicos respondam a perguntas usando conhecimento de uma base de conhecimento dedicada, aplicável a cenários empresariais internos, como Perguntas e Respostas de ordens de serviço inteligentes. Soluções existentes incluem o ajuste fino de LLMs em conjuntos de dados específicos ou o uso de recuperação vetorial para complementar os prompts do usuário com documentos relevantes do conjunto de dados. Este último, baseado em 'recuperação vetorial + Engenharia de Prompt', é mais popular devido aos altos custos e baixa pontualidade do ajuste fino. Essa abordagem envolve fatiar documentos, extrair embeddings e gerenciar atualizações de documentos, tudo o que o Lindorm AI Engine simplifica.

Pré-requisitos para Usar o Lindorm AI Engine

Antes de começar, certifique-se de que o Lindorm AI Engine esteja ativado. Verifique também se o seu motor de tabela ampla (wide table engine) é a versão 2.5.4.3 ou posterior. Se você estiver usando uma versão anterior, considere atualizar ou contatar o suporte do Lindorm para obter assistência. Além disso, confirme se o recurso de compatibilidade com o protocolo S3 e a função de recuperação vetorial de dados não estruturados estão ativados. Esses pré-requisitos garantem a integração perfeita e o desempenho ideal do Lindorm AI Engine.

Visão Geral dos Modelos de IA Utilizados

A solução de Perguntas e Respostas com dados privados envolve vários modelos de IA. Este exemplo usa o modelo de segmentação de texto BERT do ModelScope para fatiar texto, o modelo text2vec-base-chinese do Hugging Face para vetorização de texto e o modelo ChatGLM-6B-int4 do Hugging Face como LLM. É importante notar que a Alibaba Cloud não garante a legalidade, segurança ou precisão de modelos de terceiros, e os usuários são responsáveis por cumprir os termos de uso e as leis e regulamentos relevantes.

Preparação de Dados: Criando e Populando a Base de Conhecimento

Primeiro, conecte-se ao motor de tabela ampla usando ferramentas como Lindorm-cli. Em seguida, crie uma tabela para armazenar os documentos da base de conhecimento. Por exemplo: ```sql CREATE TABLE doc_table ( id VARCHAR, doc_field VARCHAR, PRIMARY KEY(id) ); ``` Em seguida, insira dados na tabela. Esses dados servirão como base de conhecimento para o sistema de Perguntas e Respostas. Exemplos de dados incluem informações sobre recursos, atualizações e capacidades do Lindorm.

Implementação de Perguntas e Respostas com Recuperação de Volume Completo

Para implementar Perguntas e Respostas com recuperação de volume completo, crie um modelo usando a instrução `CREATE MODEL`, especificando a tabela de origem, campo de destino, tarefa, algoritmo e configurações. Por exemplo: ```sql CREATE MODEL rqa_model FROM doc_table TARGET doc_field TASK RETRIEVAL_QA ALGORITHM CHATGLM3_6B SETTINGS (doc_id_column 'id'); ``` Em seguida, execute Perguntas e Respostas de recuperação usando a função `ai_infer`: ```sql SELECT ai_infer('rqa_model', 'Lindorm是什么'); ``` O resultado será uma resposta gerada pelo LLM com base na base de conhecimento.

Implementação de Perguntas e Respostas com Recuperação Incremental

Para habilitar o processamento incremental, que lida automaticamente com documentos novos, modificados ou excluídos na base de conhecimento, você precisa ativar o motor de stream e a assinatura de dados. Crie um canal de assinatura de dados via LTS no modo Pull, especificando o nome da tabela Lindorm e o nome do tópico Kafka. Em seguida, crie um modelo de Perguntas e Respostas de recuperação incremental: ```sql CREATE MODEL rqa_model FROM doc_table TARGET doc_field TASK RETRIEVAL_QA ALGORITHM CHATGLM3_6B SETTINGS (doc_id_column 'id', incremental_train 'on', lts_topic 'rqa_xxx_topic' ); ``` Execute as Perguntas e Respostas de recuperação como antes: ```sql SELECT ai_infer('rqa_model', 'Lindorm是什么'); ``` O resultado refletirá a base de conhecimento atualizada.

Recuperação Semântica (Opcional)

Se você precisar integrar com outros LLMs, pode criar um modelo de recuperação semântica para permitir que o Lindorm execute apenas funções de recuperação semântica da base de conhecimento (incluindo fatiamento de documentos, vetorização e recuperação vetorial). Crie um modelo de recuperação semântica que processe apenas documentos de volume completo: ```sql CREATE MODEL sr_model FROM doc_table TARGET doc_field TASK SEMANTIC_RETRIEVAL ALGORITHM TEXT2VEC_BASE_CHINESE SETTINGS (doc_id_column 'id'); ``` Execute a recuperação semântica: ```sql SELECT ai_infer('sr_model', 'Lindorm是什么'); ``` Opcionalmente, você pode definir o parâmetro `score` para retornar pontuações de similaridade semântica.

Resumo: Simplificando Perguntas e Respostas de Conhecimento com o Lindorm AI Engine

O Lindorm AI Engine oferece uma solução abrangente e eficiente para construir aplicações AIGC de Perguntas e Respostas com dados privados. Ao alavancar suas capacidades de busca vetorial integradas e interface SQL simplificada, os desenvolvedores podem criar sistemas de Perguntas e Respostas inteligentes com facilidade, reduzindo o tempo e a complexidade de desenvolvimento. Se você precisa de recuperação de volume completo, atualizações incrementais ou busca semântica, o Lindorm AI Engine oferece as ferramentas e a flexibilidade para atender às suas necessidades.

 Link original: https://help.aliyun.com/document_detail/2401799.html

Comentário(0)

user's avatar

      Ferramentas Relacionadas