Карты клеток для ИИ: Революция в биомедицинских исследованиях с помощью данных, готовых для ИИ
Углубленное обсуждение
Технический
0 0 1
В этой статье представлен проект Cell Maps for Artificial Intelligence (CM4AI), подробно описывающий его цели, методологии и этические соображения при создании готовых для ИИ наборов данных клеточной архитектуры человека. Обсуждается интеграция мультимодальных данных, включая протеомику и генетические пертурбации, для создания иерархических карт клеток, которые способствуют продвинутым биомедицинским исследованиям с помощью ИИ.
основные моменты
уникальные идеи
практическое применение
ключевые темы
ключевые выводы
результаты обучения
• основные моменты
1
Комплексный обзор целей и методологий проекта CM4AI.
2
Интеграция передовых методов, таких как CRISPR и масс-спектрометрия, для генерации данных.
3
Акцент на этических соображениях и готовности биомедицинских данных к ИИ.
• уникальные идеи
1
Использование иерархических ориентированных ациклических графов (DAG) для представления клеточной архитектуры.
2
Инновационная интеграция нескольких потоков данных для расширенных приложений ИИ в геномике.
• практическое применение
Статья предоставляет подробную основу для исследователей, заинтересованных в использовании готовых для ИИ наборов данных для биомедицинских исследований, включая практические методологии и этические рекомендации.
• ключевые темы
1
Готовые для ИИ наборы данных
2
Картирование клеточной архитектуры
3
Этика в биомедицинских исследованиях
• ключевые выводы
1
Инновационный подход к созданию готовых для ИИ биомедицинских данных.
2
Фокус на этических аспектах и стандартах использования данных.
3
Интеграция передовых технологий для комплексного анализа клеток.
• результаты обучения
1
Понять методологии генерации готовых для ИИ биомедицинских наборов данных.
2
Получить представление об этических соображениях в биомедицинских исследованиях.
3
Узнать об интеграции мультимодальных данных для расширенных приложений ИИ.
“ Введение в Cell Maps for Artificial Intelligence (CM4AI)
Проект Cell Maps for Artificial Intelligence (CM4AI), проект по генерации данных функциональной геномики в рамках программы NIH Bridge2AI, направлен на революционизацию биомедицинских исследований с помощью ИИ. Его основная миссия — создавать этичные, готовые для ИИ наборы данных клеточной архитектуры, полученные из мультимодальных данных, собранных из клеточных линий человека. Эта инициатива призвана предоставить исследователям инструменты и данные, необходимые для разработки трансформационных приложений ИИ в биомедицине. CM4AI фокусируется на трех основных столпах: Данные, Люди и Этика, организованных в шесть модулей, охватывающих сбор данных, инструменты, стандарты, развитие навыков, командную работу и этические соображения. Создавая машиночитаемые иерархические карты клеточной архитектуры, CM4AI обеспечивает более глубокое понимание клеточных процессов и их влияния на здоровье человека.
“ Понимание карт клеток: иерархический взгляд на клеточную архитектуру
Карты клеток — это иерархические ориентированные ациклические графы (DAG), которые представляют организацию белков внутри клетки в различных масштабах. Каждый узел в графе представляет собой совокупность белков, находящихся в непосредственной близости, от крупных клеточных компартментов, таких как ядро и митохондрии, до более мелких белковых комплексов. Эти карты строятся с использованием данных из измененных и неизмененных клеточных линий, включая раковые клеточные линии и индуцированные плюрипотентные стволовые клетки (iPSC). Для генерации сетей белковых взаимодействий и выявления локализации белков используются такие методы, как аффинная очистка-масс-спектрометрия (AP-MS) и иммунофлуоресцентное (IF) окрашивание. Интегрируя эти данные, карты клеток обеспечивают основу для интерпретации генетических вариантов и мутаций, и их можно использовать в инструментах ИИ для видимого машинного обучения, чтобы понять, как белковые комплексы влияют на прогнозирование фенотипов на клеточном уровне.
“ Этичные и готовые для ИИ биомедицинские данные: ключевые принципы
CM4AI определяет биомедицинские данные, готовые для ИИ, как полностью охарактеризованные FAIR-данные с известным происхождением, этично и надежно обработанные для приложений ИИ. Это включает обеспечение доступности, описания и валидации используемых моделей и программного обеспечения, а также возможность объяснения и интерпретации сделанных прогнозов. Ключевые принципы включают: FAIRness (находимость, доступность, интероперабельность, повторное использование), происхождение (доступность вычислительных графов), характеризация (полные схемы и листы данных), объяснимость (статистическая характеризация и ограничения) и этические соображения (этичное обращение с субъектами и ответственный анализ данных). CM4AI использует расширенную версию фреймворка FAIRSCAPE для создания основы для готовности к ИИ, уделяя особое внимание богатым метаданным, постоянным идентификаторам и процедурам валидации.
“ Методы: клеточные линии и методы сбора данных
CM4AI использует специфические клеточные линии, включая клеточную линию рака молочной железы MDA-MB-468 и линию iPSC KOLF2.1J, обе этично полученные. Сбор данных включает картирование белок-белковых взаимодействий (PPI) с использованием AP-MS и SEC-MS, картирование пространственной протеомики с использованием иммунофлуоресценции и картирование генетических пертурбаций с использованием одноклеточных CRISPR-скринингов. Для картирования PPI метятся регуляторы хроматина, и их взаимодействия анализируются в различных условиях. Картирование пространственной протеомики включает автоматизированные протоколы фиксации и пермеабилизации для картирования субклеточной организации ключевых белков. Генетическое картирование пертурбаций использует CRISPR-скрининги для пертурбации регуляторов хроматина и анализа полученных данных.
Конвейер Multi-Scale Integrated Cell (MuSIC) является ключевым инструментом для интеграции данных и создания карт клеток из нескольких входных потоков данных. Конвейер включает сегменты для загрузки данных PPI и изображений, генерации эмбеддингов с использованием моделей глубокого обучения, совместного эмбеддинга для интеграции информации PPI и изображений, обнаружения белковых сообществ, создания иерархии и оценки иерархии. Конвейер взаимодействует с инфраструктурой FAIRSCAPE для валидации входных данных и создания пакетов RO-Crate. Также исследуется интегративное моделирование структур для повышения понимания сообществ MuSIC.
“ Стандарты: упаковка для готовности к ИИ и интеграция данных
CM4AI уделяет особое внимание упаковке для готовности к ИИ посредством разработки стандартов для интеграции данных и управления метаданными. Это включает создание словарей данных, стандартов форматирования и API метаданных и происхождения FAIRSCAPE. Цель состоит в том, чтобы обеспечить легкий доступ, интероперабельность и повторное использование данных для приложений ИИ. Проект также фокусируется на сопоставлении элементов данных с общедоступными онтологическими словарями и использовании мини-словарей данных в формате JSON-Schema.
“ Применение карт клеток в исследованиях ИИ
Карты клеток, созданные CM4AI, имеют множество применений в исследованиях ИИ. Они могут использоваться для интерпретации генетических вариантов и мутаций, понимания того, как белковые комплексы влияют на фенотипы на клеточном уровне, и разработки инструментов ИИ для видимого машинного обучения. Предоставляя комплексное представление клеточной архитектуры, карты клеток позволяют исследователям создавать более точные и эффективные модели ИИ для биомедицинских приложений. Эти модели могут использоваться для прогнозирования исходов заболеваний, выявления потенциальных мишеней для лекарств и разработки персонализированных стратегий лечения.
“ Будущие направления и влияние CM4AI
Проект CM4AI постоянно развивается, а будущие направления включают улучшение функций готовности к ИИ, расширение спектра изучаемых клеточных линий и условий, а также разработку более совершенных инструментов интеграции и анализа данных. Проект призван оказать значительное влияние на биомедицинские исследования, предоставляя данные и инструменты, необходимые для разработки трансформационных приложений ИИ. Придерживаясь этических принципов и продвигая практики FAIR-данных, CM4AI гарантирует, что его ресурсы используются ответственно и на благо человечества.
Мы используем файлы cookie, необходимые для работы нашего сайта. Чтобы улучшить наш сайт, мы хотели бы использовать дополнительные файлы cookie, которые помогут нам понять, как посетители используют его, измерить трафик на наш сайт из социальных сетей и персонализировать ваш опыт. Некоторые из используемых нами файлов cookie предоставляются третьими сторонами. Чтобы принять все файлы cookie, нажмите 'Принять'. Чтобы отклонить все необязательные файлы cookie, нажмите 'Отклонить'.
Комментарий(0)