Создайте бизнес AIGC для ответов на вопросы по знаниям частных данных с помощью Lindorm AI Engine
In-depth discussion
Technical
0 0 1
В статье представлено, как использовать Lindorm AI Engine для создания бизнес-приложений AIGC для ответов на вопросы по знаниям частных данных, обсуждаются решения на основе векторного поиска и Prompt Engineering, предоставляются подробные шаги и примеры кода, направленные на помощь пользователям в упрощении процесса разработки приложений для ответов на вопросы.
основные моменты
уникальные идеи
практическое применение
ключевые темы
ключевые выводы
результаты обучения
• основные моменты
1
Глубоко рассмотрены методы построения ответов на вопросы по знаниям частных данных
2
Предоставлены подробные шаги и примеры кода
3
Объединены новейшие технологии и практики ИИ
• уникальные идеи
1
Представлены решения на основе векторного поиска и Prompt Engineering
2
Проанализированы ограничения метода FineTune и альтернативные решения
• практическое применение
Статья предоставляет пользователям практические шаги и примеры, помогая им быстро создавать системы ответов на вопросы в реальных приложениях.
• ключевые темы
1
Lindorm AI Engine
2
Ответы на вопросы по знаниям частных данных
3
Векторный поиск и Prompt Engineering
• ключевые выводы
1
Предлагает комплексное решение, упрощающее разработку приложений
2
Объединяет несколько моделей ИИ для повышения точности ответов на вопросы
3
Подробное руководство по эксплуатации и примеры кода
• результаты обучения
1
Овладеть навыками создания систем ответов на вопросы с помощью Lindorm AI Engine
2
Понять применение векторного поиска и Prompt Engineering
3
Быть способным самостоятельно реализовать построение ответов на вопросы по знаниям частных данных
“ Введение в Lindorm AI Engine для ответов на вопросы по знаниям
Lindorm AI Engine предлагает комплексное решение для создания приложений AIGC для ответов на вопросы по знаниям частных данных. Интегрируя Lindorm AI Engine со встроенными возможностями векторного поиска, пользователи могут легко создавать функции ответов на вопросы по знаниям с помощью одного SQL-запроса, что значительно упрощает разработку приложений. Это устраняет сложности, связанные с традиционными методами, такими как дообучение больших языковых моделей (LLM) или отдельное управление векторными базами данных.
“ Контекст: Создание систем ответов на вопросы по знаниям частных данных
Растет спрос на системы ответов на вопросы по знаниям частных данных на основе больших языковых моделей (LLM). Цель состоит в том, чтобы позволить LLM, обученным на общедоступных корпусах, отвечать на вопросы, используя знания из выделенной базы знаний, применимой к внутренним корпоративным сценариям, таким как ответы на вопросы по рабочим заказам. Существующие решения включают дообучение LLM на конкретных наборах данных или использование векторного поиска для дополнения пользовательских запросов соответствующими документами из набора данных. Последний подход, основанный на «векторном поиске + Prompt Engineering», более популярен из-за высоких затрат и низкой своевременности дообучения. Этот подход включает нарезку документов, извлечение эмбеддингов и управление обновлениями документов, все это Lindorm AI Engine упрощает.
“ Предварительные требования для использования Lindorm AI Engine
Прежде чем приступить к работе, убедитесь, что Lindorm AI Engine активирован. Также убедитесь, что ваша широкотабличная база данных имеет версию 2.5.4.3 или новее. Если вы используете более раннюю версию, рассмотрите возможность обновления или обратитесь в службу поддержки Lindorm за помощью. Кроме того, убедитесь, что включена функция совместимости с протоколом S3 и функция векторного поиска неструктурированных данных. Эти предварительные условия обеспечивают бесшовную интеграцию и оптимальную производительность Lindorm AI Engine.
“ Обзор используемых моделей ИИ
Решение для ответов на вопросы по знаниям частных данных включает несколько моделей ИИ. В этом примере используется модель сегментации текста BERT из ModelScope для нарезки текста, модель text2vec-base-chinese из Hugging Face для векторизации текста и модель ChatGLM-6B-int4 из Hugging Face в качестве LLM. Важно отметить, что Alibaba Cloud не гарантирует законность, безопасность или точность сторонних моделей, и пользователи несут ответственность за соблюдение условий использования и применимых законов и нормативных актов.
“ Подготовка данных: Создание и заполнение базы знаний
Сначала подключитесь к широкотабличной базе данных с помощью таких инструментов, как Lindorm-cli. Затем создайте таблицу для хранения документов базы знаний. Например:
```sql
CREATE TABLE doc_table (
id VARCHAR,
doc_field VARCHAR,
PRIMARY KEY(id)
);
```
Затем вставьте данные в таблицу. Эти данные послужат базой знаний для системы ответов на вопросы. Пример данных включает информацию о функциях Lindorm, обновлениях и возможностях.
“ Реализация ответов на вопросы с полным поиском по объему
Для реализации ответов на вопросы с полным поиском по объему создайте модель с помощью оператора `CREATE MODEL`, указав исходную таблицу, целевое поле, задачу, алгоритм и настройки. Например:
```sql
CREATE MODEL rqa_model
FROM doc_table
TARGET doc_field
TASK RETRIEVAL_QA
ALGORITHM CHATGLM3_6B
SETTINGS (doc_id_column 'id');
```
Затем выполните запрос на получение ответов с помощью функции `ai_infer`:
```sql
SELECT ai_infer('rqa_model', 'Lindorm是什么');
```
Результатом будет ответ, сгенерированный LLM на основе базы знаний.
“ Реализация инкрементных ответов на вопросы
Чтобы включить инкрементную обработку, которая автоматически обрабатывает новые, измененные или удаленные документы в базе знаний, вам необходимо активировать потоковый движок и подписку на данные. Создайте канал подписки на данные через LTS в режиме Pull, указав имя таблицы Lindorm и имя темы Kafka. Затем создайте модель инкрементных ответов на вопросы:
```sql
CREATE MODEL rqa_model
FROM doc_table
TARGET doc_field
TASK RETRIEVAL_QA
ALGORITHM CHATGLM3_6B
SETTINGS (doc_id_column 'id',
incremental_train 'on',
lts_topic 'rqa_xxx_topic' );
```
Выполните запрос на получение ответов, как и раньше:
```sql
SELECT ai_infer('rqa_model', 'Lindorm是什么');
```
Результат будет отражать обновленную базу знаний.
“ Семантический поиск (необязательно)
Если вам нужно интегрироваться с другими LLM, вы можете создать модель семантического поиска, чтобы Lindorm выполнял только функции семантического поиска по базе знаний (включая нарезку документов, векторизацию и векторный поиск). Создайте модель семантического поиска, которая обрабатывает только полные документы:
```sql
CREATE MODEL sr_model
FROM doc_table
TARGET doc_field
TASK SEMANTIC_RETRIEVAL
ALGORITHM TEXT2VEC_BASE_CHINESE
SETTINGS (doc_id_column 'id');
```
Выполните семантический поиск:
```sql
SELECT ai_infer('sr_model', 'Lindorm是什么');
```
При желании вы можете установить параметр `score` для возврата оценок семантического сходства.
“ Резюме: Оптимизация ответов на вопросы по знаниям с помощью Lindorm AI Engine
Lindorm AI Engine предлагает комплексное и эффективное решение для создания бизнес-приложений AIGC для ответов на вопросы по знаниям частных данных. Используя его встроенные возможности векторного поиска и упрощенный SQL-интерфейс, разработчики могут легко создавать интеллектуальные системы ответов на вопросы, сокращая время и сложность разработки. Независимо от того, нужен ли вам полный поиск по объему, инкрементные обновления или семантический поиск, Lindorm AI Engine предлагает инструменты и гибкость для удовлетворения ваших потребностей.
Мы используем файлы cookie, необходимые для работы нашего сайта. Чтобы улучшить наш сайт, мы хотели бы использовать дополнительные файлы cookie, которые помогут нам понять, как посетители используют его, измерить трафик на наш сайт из социальных сетей и персонализировать ваш опыт. Некоторые из используемых нами файлов cookie предоставляются третьими сторонами. Чтобы принять все файлы cookie, нажмите 'Принять'. Чтобы отклонить все необязательные файлы cookie, нажмите 'Отклонить'.
Комментарий(0)