Whisper: бесплатная система автоматического распознавания речи
В период 2020 – 2022 гг. Блокчейн и технологии DeFi возглавляемые в основном криптовалютами, они привлекли большое внимание в технологической сфере. Особенно на сайтах, посвященных бесплатные и открытые технологии, так как многие из них были сгенерированы из этой базы.
И вместе с ними мы надеемся, что со временем произойдет скачок или повышение удобства использования наших операционных систем GNU/Linux благодаря большему количеству бесплатных приложений и платформ, а также более децентрализованным и безопасным. Хотя по сей день в этом есть некоторый прогресс. Но, сейчас вполне возможно, на ближайшие 3 года и более трендом является использование Технологии искусственного интеллекта (ИИ). Технологии, которые, несомненно, ChatGPT, Сидней, Bard, ЛАМА и другие подобные, Whisper, у них будет возможность достичь той же цели.
Но, прежде чем начать этот пост о «Шепот», бесплатная система автоматического распознавания речи, мы рекомендуем вам изучить, позже, предыдущий связанный пост:
Whisper: открытый исходный код + AI + ASR
Что такое шепот?
Наверняка многие уже знают технология GPT (Generative Pre-trained Transformer на английском или Испанский генеративный предварительно обученный преобразователь) из OpenAI. который является модель искусственного интеллекта, позволяющая генерировать письменный язык за счет использования авторегрессивной языковой модели, то есть алгоритма, который позволяет создавать следующее лучшее слово, которое будет следовать за данным текстом. И что он стал чрезвычайно известен благодаря ChatGPT.
ChatGPT — это разработанная система обработки естественного языка (NLP) с открытым исходным кодом, предназначенная для создания человеческих разговоров из входного текста. Поэтому он широко используется в различных приложениях и платформах для создания чат-ботов, понимания естественного языка (NLU) и автоматизированного обслуживания клиентов, среди многих других.
Тем не менее, OpenAI имеет еще много проектов ИИ, среди которых выделяется «Шепот». Который, согласно его официальному сайту, описывается как проект с открытым исходным кодом, предоставляющий универсальная модель распознавания речи который может транскрибировать, идентифицировать и переводить несколько языков.
Whisper — это система автоматического распознавания речи (ASR), обученная на 680.000 XNUMX часов контролируемых многоязычных и многозадачных данных, собранных из Интернета. Мы показываем, что использование такого большого и разнообразного набора данных повышает устойчивость к акцентам, фоновому шуму и техническому языку. Шепот Презентация
Хотя в его официальный раздел на GitHub, добавьте дополнительные сведения о нем следующим образом:
Whisper Это модель распознавания речи общего назначения. Он обучен на большом разнообразном наборе аудиоданных, а также является многозадачной моделью, которая может выполнять многоязычное распознавание речи, а также перевод речи и идентификацию языка.
Что эта технология искусственного интеллекта может принести операционным системам?
А также, ChatGPT Он пришел, чтобы остаться и помочь с такими задачами, как более точный и удобный поиск в Интернете; генерировать, обобщать и переводить тексты; и ведите переговоры или помогайте людям с различными потребностями, вводя текст. Whisper он может легко выполнять те же задачи, что и уши и рот, которые могут быть так необходимы, чтобы сделать задачу выполнения всего этого с помощью мыши и клавиатуры гораздо более удобной.
Поэтому и в Linux, и в др. Настольные и мобильные операционные системы, скоро мы сможем увидеть новое поколение приложений ИИ, с чрезвычайно продвинутым уровнем взаимодействия, который мог легко обойтись без ручного ввода текста. Другими словами, они могли слушать, понимать и отвечать своему собеседнику через микрофон и рожки.
Поэтому не было бы ничего необычного, если бы в следующем десятилетии в включите свой компьютер с GNU/Linux, первое, что появляется на экране, это лицо (GUI) ИИ, приветствуя нас и спрашивая, что мы хотим сделать, чтобы открыть приложения и начать выполнять запрошенные команды.
Например: выполнение поиска в Интернете, создание документа под диктовку, открытие редактора изображений или видео для создания или загрузки файла для изменения и многое другое.
Наконец, Whisper в настоящее время может быть устанавливается на линукс и виндовс или протестировано онлайн в Интернете Игровая площадка OpenAI. Хотя есть интересные инструменты, которые уже используют эту технологию, вот два хороших примера: Инструмент Whisper Typer y Перевод речи.
Резюме
Короче говоря, будем надеяться, что все эти новые технологии искусственного интеллекта доступны и строятся, особенно те, которые имеют бесплатное и открытое происхождение, основу или лицензию, такие как ChatGPT и OpenAI Whisper, способствуют многим положительным вещам для человечества. Но, прежде всего, для того, чтобы наши нынешние бесплатные и открытые операционные системы могли продолжать улучшаться в плане удобства использования и доступности, предлагая гораздо более продвинутые и удобные приложения и функции для любого типа пользователей.
Если вам понравился этот пост, не переставай делиться этим с другими на ваших сайтах, каналах, в группах или любимых сообществах социальных сетей или систем обмена сообщениями. И, наконец, помните посетите наш стартовая страница узнать больше новостей, а также присоединиться к нашему официальному каналу Telegram от DesdeLinux, Запад группа для получения дополнительной информации по сегодняшней теме.
2023-03-02T13:56:23
приложений