Содержание:
Патент на российский ИИ
Как стало известно CNews, российские разработчики из отечественной компании Smart Engines получили в США патент на свою фирменную ИТ-разработку. Изобретение призвано оптимизировать работу нейросетевых архитектур, которые используются для распознавания изображений. Об этом редакции рассказали представители компании.
Авторами изобретения являются программист Smart Engines Александр Шешкус, генеральный директор компании Владимир Викторович Арлазаров, ее технический директор Дмитрий Николаев, директор по науке Владимир Львович Арлазаров. Большинство из них имеет различные ученые степени, вплоть до доктора технических наук.
Патент № US 11636608 B2 датирован 25 апреля 2023 г. (копия документа имеется в распоряжении CNews). Запатентованное решение уже используется в программных продуктах Smart Engines для автономного распознавания паспортов, ID-карт и других документов.
Фото: Smart Engines США зарегистрировали патент на разработанный в Smart Engines ИИ-метод
Smart Engines позиционирует себя в качестве научно-исследовательской компании, специализирующаяся на разработке алгоритмов компьютерного зрения, машинного обучения, искусственного интеллекта (ИИ), распознавании образов и поставке комплексных программных решений для автоматизации распознавания и ввода данных из документов в видеопотоке, на фотографиях и сканах.
В начале февраля 2023 г. CNews писал о другом патенте компании, также получено ею в США. Тогда Smart Engines зафиксировала за океаном права на систему локализации и идентификации документов на изображениях. В общей сложности Smart Engines зарегистрировала три патента в США, восемь — в России, а также создала 26 так называемых полезных моделей.
Что именно разработали россияне
Авторы зарегистрированного на днях изобретения, по их заверению, предложили новую нейросетевую архитектуру, объединяющую блоки, используемые в современных нейросетях, с классическим инструментом анализа изображений реального мира — преобразованием Хафа.
Фото: Smart Engines Изображение иллюстрирует, каким образом нейронная сеть обнаруживает точку схода с помощью преобразования Хафа, опираясь на прямые на исходном изображении. Решение этой задачи необходимо, например, при создании беспилотников
«Основой современных нейросетей, обрабатывающих изображения, являются сверточные нейронные слои. В них каждый нейрон обрабатывает маленький кусочек входного изображения. Такие нейросети воспринимают изображение как иерархию произвольных деталей, а геометрические построения для них неестественны. Мы же предложили слой, в котором каждый нейрон обрабатывает одну прямую, лежащую на изображении. Это и есть преобразование Хафа», — пояснил CNews Дмитрий Николаев.
По его словам, на нейронную сеть можно смотреть как на большую математическую формулу. Каждый ее слой — это следующая функция, примененная к предыдущей. Если вы вставляете в эту последовательность новое преобразование, «то в другой философской парадигме» вы вставляете в нейросеть слой нейронов, которые определенным образом связаны с предыдущими и что-то считают. «Мы добавили нейроны, которые получают сигнал от нейронов предыдущего слоя, лежащих вдоль прямой. А с точки зрения математики этот слой — преобразование Хафа».
Фото: Smart Engines Первый столбец иллюстрирует, как нейросеть обнаруживает внутренние точки документа с использованием преобразования Хафа, второй — как без него. Сеть с Хафом имеет в сто раз меньше обучаемых параметров, а также меньше весит и быстрее работает
Разработчики рассчитывают, что предложенная ими архитектура сможет оказать влияние на общее развитие нейросетевых технологий в компьютерном зрении. «Первые исследования хафовских нейросетей, уже опубликованные в научной периодике, полностью подтверждают эту идею», — заверяют они.
В пику ChatGPT
Комментируя свое изобретение, сотрудники Smart Engines не избежали сравнения разработки с алгоритмами, используемыми в ИИ-продукте ChatGPT — чат-боте американской компании OpenAI, который способен вести диалог с человеком и генерировать тексты и изображения.
«Нейросети замечательно извлекают информацию из примеров, но их практически невозможно научить непреложным законам физики или математики, — рассуждает Владимир Львович Арлазаров. — Показательны недавние упражнения сети ChatGPT в арифметике. При умножении больших чисел сеть правильно указывает первые и последние цифры результата, и даже угадывает его длину, а вот центральные цифры ставит “от балды”. Довольно забавный результат, ведь для правильного решения требуется в миллиарды раз меньше ресурсов, чем те, что есть в распоряжении у нейросети. Встает вопрос: а можно ли вообще изучать математику на примерах?».
Некоторые подробности изобретения
Самое частое использование преобразования Хафа — это поиск и выделение прямых, возвращается к вышеупомянутой теме Александр Шешкус. — Они в области обработки и анализа изображений играют важнейшую роль: это и дороги, и дома, и границы документа, и строки, и рентгеновские лучи, формирующие томограмму, и многое другое».
Маркет
Однако, как отмечает эксперт, эти отрезки почти всегда не совсем прямые, часто зашумлены или видны только частично, имеют разную длину. Поэтому проведение классического Хаф-анализа изображения представляет собой довольно сложную задачу. «Между тем, как раз с теми проблемами, которые затрудняют Хаф-анализ изображения, прекрасно справляются нейросети и, более того, существуют систематические методы решения подобных проблем», — говорит он.
По словам Дмитрия Николаева, сейчас большая часть задач технического зрения решается с использованием нейросетей, в развитии которых много лет не ставился вопрос экономии. При этом именно для задач зрения характерны большие объемы входных данных даже в тривиальных приложениях. В результате проблема сокращения вычислительных затрат стоит крайне остро.
«Предложенная нами архитектура с использованием преобразования Хафа обеспечивает конкурентное качество при значительно меньшем количестве обучаемых параметров и при требовании меньшего количества вычислительных мощностей», — подчеркивает он.
Зачем российской компании патенты в США
Как рассказал CNews Владимир Викторович Арлазаров, у Smart Engines на сегодняшний день уже есть клиенты на рынке США, использующие ее систему распознавания документов.
импортонезависимость
«Это очень важно для любой научно-исследовательской компании — защищать свое ноу-хау патентами, в том числе патентами США», — уверен он. При этом, как можно было заключить с его слов, занимаясь патентованием за рубежом, компания тем самым повышает собственную стоимость.
Несколько фактов о Smart Engines
По данным компании, она была основана в 2016 г. учеными ряда институтов Российской академии наук (РАН) в области распознавания и обработки изображений. Сегодня в Smart Engines работают более 70 сотрудников.
По сведениям ЕГРЮЛ, учредителями зарегистрированного в Москве ООО «Смарт энджинс сервис» выступают Владимир Викторович Арлазаров с долей в 25,39%, Владимир Львович Арлазаров — 17,05%, Дмитрий Николаев — 17,05%, Сергей Усилин — 17,05%, Константин Булатов — 10,23%, Александр Шешкус — 10,23%, Никита Арлазаров — 3%.
По данным «Контур.фокуса», по итогам 2022 г. выручка организации составила 382,9 млн руб. с приростом этого показателя на 36% по сравнению с предыдущим годом.Чистая прибыль оказалась на уровне 171,6 млн руб.