Construa Negócios AIGC de Perguntas e Respostas com Dados Privados Usando o Lindorm AI Engine
Discussão aprofundada
Técnico
0 0 1
Este artigo descreve como usar o Lindorm AI Engine para construir um negócio AIGC de Perguntas e Respostas com dados privados, discute soluções baseadas em recuperação vetorial e Engenharia de Prompt, fornece etapas detalhadas de operação e código de exemplo, com o objetivo de ajudar os usuários a simplificar o processo de desenvolvimento de aplicações de Perguntas e Respostas.
pontos principais
insights únicos
aplicações práticas
tópicos-chave
insights principais
resultados de aprendizagem
• pontos principais
1
Discute em profundidade os métodos de construção de Perguntas e Respostas com dados privados
2
Fornece etapas detalhadas de operação e código de exemplo
3
Combina as mais recentes tecnologias e práticas de IA
• insights únicos
1
Apresenta soluções baseadas em recuperação vetorial e Engenharia de Prompt
2
Analisa as limitações do método FineTune e as alternativas
• aplicações práticas
O artigo oferece aos usuários etapas e exemplos práticos para ajudá-los a construir rapidamente sistemas de Perguntas e Respostas em aplicações reais.
• tópicos-chave
1
Lindorm AI Engine
2
Perguntas e Respostas com Dados Privados
3
Recuperação Vetorial e Engenharia de Prompt
• insights principais
1
Oferece uma solução completa para simplificar o desenvolvimento de aplicações
2
Combina vários modelos de IA para melhorar a precisão das Perguntas e Respostas
3
Guia de operação detalhado e exemplos de código
• resultados de aprendizagem
1
Dominar as habilidades para construir sistemas de Perguntas e Respostas usando o Lindorm AI Engine
2
Compreender a aplicação da recuperação vetorial e da Engenharia de Prompt
3
Ser capaz de implementar independentemente a construção de Perguntas e Respostas com dados privados
“ Introdução ao Lindorm AI Engine para Perguntas e Respostas de Conhecimento
O Lindorm AI Engine oferece uma solução completa para construir aplicações AIGC de Perguntas e Respostas com dados privados. Ao integrar o Lindorm AI Engine com capacidades de busca vetorial integradas, os usuários podem facilmente construir funcionalidades de Perguntas e Respostas de conhecimento com uma única instrução SQL, simplificando significativamente o desenvolvimento de aplicações. Isso elimina as complexidades associadas a métodos tradicionais, como o ajuste fino de modelos de linguagem grandes (LLMs) ou o gerenciamento de bancos de dados vetoriais separadamente.
“ Contexto: Construindo Sistemas de Perguntas e Respostas com Dados Privados
A demanda por sistemas de Perguntas e Respostas com dados privados baseados em Modelos de Linguagem Grandes (LLMs) está crescendo. O objetivo é permitir que LLMs treinados em corpora públicos respondam a perguntas usando conhecimento de uma base de conhecimento dedicada, aplicável a cenários empresariais internos, como Perguntas e Respostas de ordens de serviço inteligentes. Soluções existentes incluem o ajuste fino de LLMs em conjuntos de dados específicos ou o uso de recuperação vetorial para complementar os prompts do usuário com documentos relevantes do conjunto de dados. Este último, baseado em 'recuperação vetorial + Engenharia de Prompt', é mais popular devido aos altos custos e baixa pontualidade do ajuste fino. Essa abordagem envolve fatiar documentos, extrair embeddings e gerenciar atualizações de documentos, tudo o que o Lindorm AI Engine simplifica.
“ Pré-requisitos para Usar o Lindorm AI Engine
Antes de começar, certifique-se de que o Lindorm AI Engine esteja ativado. Verifique também se o seu motor de tabela ampla (wide table engine) é a versão 2.5.4.3 ou posterior. Se você estiver usando uma versão anterior, considere atualizar ou contatar o suporte do Lindorm para obter assistência. Além disso, confirme se o recurso de compatibilidade com o protocolo S3 e a função de recuperação vetorial de dados não estruturados estão ativados. Esses pré-requisitos garantem a integração perfeita e o desempenho ideal do Lindorm AI Engine.
“ Visão Geral dos Modelos de IA Utilizados
A solução de Perguntas e Respostas com dados privados envolve vários modelos de IA. Este exemplo usa o modelo de segmentação de texto BERT do ModelScope para fatiar texto, o modelo text2vec-base-chinese do Hugging Face para vetorização de texto e o modelo ChatGLM-6B-int4 do Hugging Face como LLM. É importante notar que a Alibaba Cloud não garante a legalidade, segurança ou precisão de modelos de terceiros, e os usuários são responsáveis por cumprir os termos de uso e as leis e regulamentos relevantes.
“ Preparação de Dados: Criando e Populando a Base de Conhecimento
Primeiro, conecte-se ao motor de tabela ampla usando ferramentas como Lindorm-cli. Em seguida, crie uma tabela para armazenar os documentos da base de conhecimento. Por exemplo:
```sql
CREATE TABLE doc_table (
id VARCHAR,
doc_field VARCHAR,
PRIMARY KEY(id)
);
```
Em seguida, insira dados na tabela. Esses dados servirão como base de conhecimento para o sistema de Perguntas e Respostas. Exemplos de dados incluem informações sobre recursos, atualizações e capacidades do Lindorm.
“ Implementação de Perguntas e Respostas com Recuperação de Volume Completo
Para implementar Perguntas e Respostas com recuperação de volume completo, crie um modelo usando a instrução `CREATE MODEL`, especificando a tabela de origem, campo de destino, tarefa, algoritmo e configurações. Por exemplo:
```sql
CREATE MODEL rqa_model
FROM doc_table
TARGET doc_field
TASK RETRIEVAL_QA
ALGORITHM CHATGLM3_6B
SETTINGS (doc_id_column 'id');
```
Em seguida, execute Perguntas e Respostas de recuperação usando a função `ai_infer`:
```sql
SELECT ai_infer('rqa_model', 'Lindorm是什么');
```
O resultado será uma resposta gerada pelo LLM com base na base de conhecimento.
“ Implementação de Perguntas e Respostas com Recuperação Incremental
Para habilitar o processamento incremental, que lida automaticamente com documentos novos, modificados ou excluídos na base de conhecimento, você precisa ativar o motor de stream e a assinatura de dados. Crie um canal de assinatura de dados via LTS no modo Pull, especificando o nome da tabela Lindorm e o nome do tópico Kafka. Em seguida, crie um modelo de Perguntas e Respostas de recuperação incremental:
```sql
CREATE MODEL rqa_model
FROM doc_table
TARGET doc_field
TASK RETRIEVAL_QA
ALGORITHM CHATGLM3_6B
SETTINGS (doc_id_column 'id',
incremental_train 'on',
lts_topic 'rqa_xxx_topic' );
```
Execute as Perguntas e Respostas de recuperação como antes:
```sql
SELECT ai_infer('rqa_model', 'Lindorm是什么');
```
O resultado refletirá a base de conhecimento atualizada.
“ Recuperação Semântica (Opcional)
Se você precisar integrar com outros LLMs, pode criar um modelo de recuperação semântica para permitir que o Lindorm execute apenas funções de recuperação semântica da base de conhecimento (incluindo fatiamento de documentos, vetorização e recuperação vetorial). Crie um modelo de recuperação semântica que processe apenas documentos de volume completo:
```sql
CREATE MODEL sr_model
FROM doc_table
TARGET doc_field
TASK SEMANTIC_RETRIEVAL
ALGORITHM TEXT2VEC_BASE_CHINESE
SETTINGS (doc_id_column 'id');
```
Execute a recuperação semântica:
```sql
SELECT ai_infer('sr_model', 'Lindorm是什么');
```
Opcionalmente, você pode definir o parâmetro `score` para retornar pontuações de similaridade semântica.
“ Resumo: Simplificando Perguntas e Respostas de Conhecimento com o Lindorm AI Engine
O Lindorm AI Engine oferece uma solução abrangente e eficiente para construir aplicações AIGC de Perguntas e Respostas com dados privados. Ao alavancar suas capacidades de busca vetorial integradas e interface SQL simplificada, os desenvolvedores podem criar sistemas de Perguntas e Respostas inteligentes com facilidade, reduzindo o tempo e a complexidade de desenvolvimento. Se você precisa de recuperação de volume completo, atualizações incrementais ou busca semântica, o Lindorm AI Engine oferece as ferramentas e a flexibilidade para atender às suas necessidades.
Utilizamos cookies essenciais para o funcionamento do nosso site. Para melhorá-lo, gostaríamos de usar cookies adicionais para nos ajudar a entender como os visitantes o utilizam, medir o tráfego de plataformas de mídia social e personalizar sua experiência. Alguns dos cookies que usamos são fornecidos por terceiros. Para aceitar todos os cookies, clique em 'Aceitar'. Para rejeitar todos os cookies opcionais, clique em 'Rejeitar'.
Comentário(0)