Дженсен Хуанг из Nvidia анонсирует новый чип, который, по его словам, "потрясет мир". Статья предполагает, что речь идет о переходе на кремниевую фотонику, что может кардинально изменить архитектуру дата-центров и гонку ИИ. Автор анализиру…
Исследование по созданию эмбеддинга личности для языковых моделей. Модель обучалась выделять стиль текста, не затрагивая его смысл, что позволило управлять манерой подачи информации. Эксперимент показал возможность разделения семантики и с…
Разработана мета-модель, которая автоматически определяет состояние обучения нейронных сетей, выявляя переобучение, проблемы с данными и другие аномалии. Для обучения модели был сгенерирован датасет с различными сценариями обучения на осн…
нейросети,
машинное обучение,
мета-модель,
диагностика,
обучение
Статья сравнивает два типа высших учебных заведений Германии для обучения на бакалавриате по Computer Science и AI: Universität (классический университет) и Fachhochschule (университет прикладных наук). Рассматриваются различия в учебных п…
Германия,
AI,
образование,
Fachhochschule,
Universität,
бакалавриат,
CS,
Практика
В статье рассматривается переход от детерминированного ИИ к биомиметическим подходам. Автор критикует текущие методы, основанные на конечных автоматах, и предлагает использовать "жидкую архитектуру", имитирующую биологические процессы. Та…
В статье сравниваются методы семантического и полнотекстового поиска на примере 10 000 категорий Ozon. Рассматриваются три embedding-модели: GigaChat, Qwen3 и OpenAI. GigaChat показала лучшие результаты на русском языке, особенно в поним…
Статья рассматривает применение churn-моделей в банковской сфере, анализируя не только предсказание оттока клиентов, но и методы удержания. Обсуждаются различные подходы, включая RFM-анализ, survival-анализ и uplift-моделирование, а также …
churn-модели,
отток клиентов,
банковское дело,
AI в финансах,
удержание клиентов
Китай получил первую в мире лицензию на коммерческое использование инвазивного интерфейса «мозг-компьютер» для управления роботизированной перчаткой. Устройство предназначено для парализованных пациентов и уже получило одобрение регулирующ…
Статья описывает 8 уровней развития AI-инженерии, начиная с простых инструментов вроде автодополнения кода и заканчивая сложными системами с автоматическими циклами обратной связи. Автор подчеркивает важность контекстной инженерии, использ…
Статья рассматривает влияние искусственного интеллекта на сферу образования, анализируя как преимущества, так и недостатки использования нейросетей в обучении. Обсуждаются возможности ИИ в проверке домашних заданий, объяснении сложных тем …
ИИ в образовании,
нейросети,
образовательные технологии,
ChatGPT,
репетиторы
Исследователь Павел Борисов провел эксперименты с архитектурой MoE, подключая экспертов к замороженной языковой модели. Он исследовал самодистилляцию и выяснил, что перплексия может быть плохой метрикой для оценки рассуждений. В итоге, сам…
Статья о создании системного промпта для языковых моделей. Автор рассказывает о методах структурирования запросов, использовании математических формул для управления логикой ИИ и разделении задач на типы для оптимизации работы. Рассматрива…
Malus разработал сервис, использующий нейросети для автоматического обхода лицензий открытого кода, делая его проприетарным. Сервис решает проблему юридических рисков для корпораций, позволяя им избавляться от условий лицензий и получать …
нейросети,
открытый код,
авторское право,
юриспруденция,
ИИ,
лицензии,
Malus
Статья рассказывает о способах повышения качества ответов RAG-поиска. Автор делится советами по структурированию контента, использованию информативных заголовков, поддержанию единой терминологии и актуальности информации. Эти методы помога…
RAG,
ИИ,
поиск,
качество,
база знаний,
структурирование
Статья о тонкой настройке OpenClaw, фреймворка для создания AI-агентов. Рассматриваются шаги от установки до создания multi-agent систем, настройка конфигурации, работа с Telegram, multi-agent и heartbeat. Даются советы по настройке и прим…
В статье проведено сравнение облачных моделей Ollama (Qwen 3.5, GPT-OSS, DeepSeek v3.1) для задач code review. Оценивается качество анализа кода на реальных Pull Request, выявляются сильные и слабые стороны каждой модели. Делается вывод …
Автор собрала open-source сервис VoiceBooks для озвучки книг в Telegram, используя FastAPI, Edge TTS и Telegram Mini App. Сервис позволяет озвучивать книги разных форматов, используя нейросетевые голоса. В статье описана архитектура проект…
Статья поднимает проблему обесценивания труда разработчиков в контексте развития Open Source и AI. Автор анализирует, как бесплатный труд в опенсорсных проектах используется для обучения больших языковых моделей, что приводит к снижению це…
Open Source,
AI,
Обесценивание труда,
Разработчики,
LLM
Яндекс расширяет программу партнерства с научными лабораториями ведущих вузов, таких как ИТМО и МФТИ. Цель - объединить научные исследования с задачами бизнеса и улучшить сервисы Яндекс 360. Сотрудничество направлено на ускорение внедрени…
Яндекс,
AI,
партнерство,
вузы,
исследования,
разработка
Татарстан активно финансирует проекты в области искусственного интеллекта в различных отраслях, включая медицину, сельское хозяйство и нефтехимию. Фонд науки и технологий Республики Татарстан выделил 334,2 млн рублей на поддержку разработо…
ИИ,
Татарстан,
финансирование,
разработки,
технологии