Умные помощники и их создатели. Андрей Масалович | Кибердед

Точка сборки
24 Jun 202434:17

Summary

TLDRВ видео скрипте Александра Троцкая и Андрея Игоревича рассматривается история и современное состояние голосовых помощников, таких как Алиса и Ипполит. Обсуждается происхождение технологий голосового синтеза, начиная с древних шумеров и заканчивая современными достижениями. Авторы делятся своими взглядами на интеграцию ИИ в общество, его потенциал и ограничения, а также на возможные последствия внедрения в сферу образования и здравоохранения. Также затрагивается тема развития рынка ИИ и предоставляется прогноз на ближайшие годы.

Takeaways

  • 😀 Голосовые помощники - это технологии, которые появились давно и развивались на протяжении тысячелетий.
  • 🔍 Первый описанный голосовой помощник - это бог войны Нинурта у древних шумеров, который подсказывал хозяину, что делать в битве.
  • 📚 В 1779 году немецкий ученый Кристиан Кранштейн создал устройство для синтеза речи, хотя теоретическая основа была дана Эйлером.
  • 📝 В 19 веке Иосиф Фабер создал 'Говорящую голову', которая издавала звуки, но столкнулся с эффектом зловещей долины.
  • 🧠 В 1974 году в США была разработана система RAX, которая помогала парализованному человеку заказывать пиццу по телефону.
  • 📈 Технология голосовых помощников быстро развивается и уже вошла во все сферы жизни, включая образование и здравоохранение.
  • 🤖 Существует несколько типов голосовых помощников, от простых автоответчиков до более сложных систем с искусственным интеллектом.
  • 🔧 Голосовые помощники обучаются с использованием больших баз данных и алгоритмов, включая генеративные трансформеры и шаблоны коротких разговоров.
  • 🛑 Несмотря на успехи, голосовые помощники могут столкнуться с этическими и социальными проблемами, например, неправильными рекомендациями или ошибками.
  • 🌐 Рынок голосовых помощников продолжает расти, с прогнозом роста на 15-80% в ближайшие 3 года, что предоставляет возможности для инноваций и бизнеса.
  • 🏢 Компания 'Актика' меняет правила индустрии окон, предлагая продолжительные гарантии и доступные цены, что отражает тенденции в инновациях различных отраслей.

Q & A

  • Какой была первая попытка создания голосовых помощников?

    -Первая попытка создания голосовых помощников датируется 5000 летами до н.э. у древних шумеров, у которых был бог войны Нинурта, который мог подсказывать хозяину, что делать в нужный момент с помощью человеческого голоса.

  • Кто придумал устройство синтеза речи в 1779 году?

    -Устройство синтеза речи придумал немецкий ученый Кристиан Кранштейн, который работал в России и участвовал в конкурсе Российской академии наук на создание искусственного интеллекта.

  • Как называется эффект, с которым столкнулся Иосиф Фабер при создании его Говорящей головы?

    -Эффект, с которым столкнулся Иосиф Фабер, называется 'эффект зловещей долины'. Он описывает подсознательное страх и отторжение от объекта, когда тот начинает походить на человека, но не достигает полного сходства.

  • В каком году была разработана система RAX, позволяющая человеку с параличом лица заказать пиццу?

    -Система RAX была разработана в 1974 году в Соединенных Штатах для помощи людям с параличом лица в заказе пиццы.

  • Какие задачи были решены с помощью системы RAX?

    -Система RAX помогла человеку с параличом лица заказать пиццу по телефону, что демонстрировала возможности компьютерной технологии в упрощении повседневных задач.

  • Что такое лестничная логика и как она связана с развитием компьютеров?

    -Лестничная логика - это концепция, основанная на принципе работы триггеров, где один сигнал может открыть или закрыть другой сигнал. Эта концепция лежит в основе работы современных компьютеров.

  • Какие проблемы могут возникнуть при внедрении голосовых помощников в образовательный процесс?

    -Проблемы включают в себя отсутствие обратной связи и общения, необходимого для настройки и передачи знаний, а также высокую стоимость создания качественного общения с помощью Аватар.

  • Какие функции могут выполнять голосовые помощники в сфере медицины, как в примере системы Легина?

    -Голосовые помощники, такие как Легина, могут общаться с пожилыми людьми, помогать детям узнать состояние своих родственников, измерять медицинские показатели, напоминать о принятии лекарств и вызывать скорую помощь, если это необходимо.

  • Чем отличается генеративный трансформер, упомянутый в скрипте, от обычного генератора текста?

    -Генеративный трансформер - это сложная модель искусственного интеллекта, способная предсказывать наиболее вероятное продолжение фразы на основе обученной семантической сети, что делает генерацию текста более точной и контекстно-зависимой.

  • Какие проблемы могут возникнуть из-за некачественной обучения голосовых помощников?

    -Некачественное обучение может привести к неправильному пониманию контекста, неуместным рекомендациям, а также к неприемлемым ответам, таким как проявление ненависть, оскорбления и прочее.

  • Какие проблемы могут быть связаны с внедрением искусственного интеллекта в государственное управление?

    -Проблемы могут включать неспособность системы адаптироваться к непредвиденным обстоятельствам, невозможность учета всех внешних факторов, что может привести к неэффективному или неправильному управлению.

  • Какие преимущества предлагает компания Актика в области оконного сервиса?

    -Актика предлагает новые стандарты в оконном сервисе, включая остекление объектов любой сложности, прямую связь с руководителем, честность, надежность, открытость и гарантию на продукцию на 10 лет.

Outlines

00:00

😀 История голосовых помощников и их влияние на мир

В первом параграфе обсуждается история и развитие голосовых помощников, начиная с древних шумеров и бога войны Нинурты, который давал подсказки во время сражений. Рассматривается внедрение голосовых технологий во всех сферах жизни и их потенциальный вклад в такие роли, как учителя или политиков. Упоминаются первые шаги в области синтеза речи и важные достижения в этой области, включая работу Кристиана Кранштейна в 1770-х годах.

05:01

😉 Развитие технологии голосовых помощников и их применение

Второй параграф посвящён дальнейшему развитию голосовых помощников, начиная с Говорящей головы Иосифа Фабера и его сына, которые пытались создать бизнес на основе этой технологии. Также затрагивается концепция 'лестничной логики' и введение бинарной логики, что лежит в основе современных компьютеров. Упоминается исторический прогресс, включая разработку системы RAX в 1974 году и её влияние на повседневную жизнь.

10:03

😎 Технические достижения и проблемы голосового синтеза

Третий параграф фокусируется на технических аспектах голосового синтеза, таких как создание библиотек атак нот для музыкальных инструментов и разработка устройств, способных воспроизводить звуки с интонациями и акцентами. Обсуждается влияние российских учёных на прогресс в этой сфере и проблемы, связанные с лицензированием и коммерциализацией изобретений.

15:04

😳 Автоответчики и проблемы их использования

В четвёртом параграфе рассматривается текущее состояние голосовых помощников, их способность к простому диалогу и проблемам, связанным с автоответчиками, которые составляют большую часть рынка колл-центров. Обсуждается также потенциал голосовых помощников в более сложных задачах, отличая их от простых автоответчиков.

20:06

😡 Проблемы с этической стороной использования голосовых помощников

Пятый параграф выражает обеспокоенность некоторыми аспектами использования голосовых помощников, включая возможные этические проблемы и негативные последствия неправильного использования этих технологий. Рассматриваются случаи неправильного обучения систем, что приводит к неприемлемым результатам, и важность правильного подхода к разработке и использованию голосовых помощников.

25:07

😐 Визualизация технологий ИИ и их влияние на рынок труда

В шестом параграфе обсуждается влияние технологий ИИ на рынок труда, особенно в колл-центрах и сфере образования. Рассматриваются возможные заменители человеческого труда, такие как аватары и персональные помощники, а также проблемы, связанные с внедрением ИИ в обучение и необходимостью обратной связи в образовательном процессе.

30:08

😒 Предикции и рекомендации для успешного внедрения ИИ

В заключительном параграфе автор даёт своё видение будущего развития голосовых помощников и ИИ, предупреждая о том, что дешёвые и некачественные решения могут наносить ущерб. Он рекомендует сосредоточиться на точечных решениях и подчёркивает значимость качественных продуктов и услуг, которые могут принести реальную пользу.

Mindmap

Keywords

💡Голосовые помощники

Голосовые помощники — это интеллектуальные системы, способные общаться с пользователем с помощью речи. Они используются для различных задач, таких как управление智能家居, поиск информации или помощь в организации рабочего процесса. В видео упоминается история развития таких систем и их внедрение во все сферы жизни.

💡Искусственный интеллект

Искусственный интеллект (ИИ) — это область информатики, которая изучает способы моделирования человеческого интеллекта с помощью компьютеров. В контексте видео, ИИ используется для создания голосовых помощников и других систем, способных выполнять задачи, требующие интеллектуального подхода.

💡Синтез речи

Синтез речи — это процесс преобразования текста в речь с помощью компьютера. В видео скрипте упоминается, что это один из основных этапов в разработке голосовых помощников, который занял долгие годы исследований.

💡Аватар

Аватар в видео контексте — это виртуальное представление пользователя или персонажа, который может общаться и взаимодействовать с другими пользователями. В видео упоминается о том, что такие системы могут заменить людей в определенных сферах, таких как общение с пожилыми людьми.

💡Тьютор

Тьютор — это английское слово, обозначающее наставника или преподавателя, который обучает студентов индивидуально. В видео упоминается о том, что преподаватели, как тьюторы, могут быть заменены системой ИИ, но это потребует обратной связи и настройки.

💡Кибернетика

Кибернетика — это научная область, изучающая системы, способные саморегуляцию и обмен информацией. В видео упоминается, что кибернетика была идеей управления государством на основе современных технологий, но в практике это оказалось не так просто.

💡Эффект зловещей долины

Эффект зловещей долины — это феномен, когда похожество между человеком и искусственным объектом вызывает у людей дискомфорт или страх. В видео говорится о том, как это похожество может влиять на восприятие голосовых помощников и других систем ИИ.

💡ГЕНЕРАТИВНЫЙ Трансформер

Генеративный трансформер — это тип ИИ, который может генерировать текст на основе ученных данных. В контексте видео, такие модели используются для создания более естественного и похожего на человеческую речь ответа голосовыми помощниками.

💡СКС

СКС (Short Conversations System) — это система, которая обрабатывает короткие диалоги и предоставляет типичные шаблоны ответов. В видео упоминается, что такие системы используются для добавления оживления и натуральности в разговоры с голосовыми помощниками.

💡Актика

Актика — это компания, упоминается в конце видео скрипта, которая предлагает услуги по окнооборудованию. В контексте видео, это пример компании, которая использует принципы прогрессивных решений и надежных партнерств для обслуживания клиентов.

Highlights

Голосовые помощники происходят из древности: в Шумере бог войны Нинурта давал подсказки своим владельцам в бою.

Первый синтез речи был достигнут в 1779 году в Санкт-Петербурге благодаря немецкому ученому Кристиану Кранштейну.

Синтез речи Кранштейна включал в себя только пять различимых гласных звуков, но открыл дверь к дальнейшим разработкам.

Говорящая голова Иосифа Фабера, созданная за 7 лет, демонстрирует сложность ранних попыток создания голосовых помощников.

Эффект зловещей долины описывает отторжение людей от humanoidов, когда они становятся слишком похожими на людей.

Логические схемы и триггеры являются основой современных компьютеров и голосовых помощников.

Первое применение голосовых технологий в медицину было в 1974 году для помощи парализованному человеку.

Современные голосовые помощники используют генеративные преобразователи и большие библиотеки для речи.

Автоответчики и спам-звонки являются одним из применений голосовых технологий, составляя 70% рынка.

Голосовые помощники обучаются на данных, включая непроверенные и сырые, что может привести к неправильным рекомендациям.

Руководители проектов голосовых помощников часто недооценивают важность лицензирования и интеллектуальной собственности.

Система 'Легина' предложила индивидуализированный подход к медицинскому обслуживанию пожилых людей.

Искусственный интеллект в образовании может быть полезен, но требует обратной связи и настройки.

Кибернетика и идеи управления государством на основе распределенных систем не всегда оправдывают ожидания.

Рынок голосовых помощников в России растет, предоставляя возможности для инноваций и бизнеса.

Компания 'Актика' меняет правила оконного сервиса, предлагая инновационные решения и гарантии.

Transcripts

play00:00

[музыка]

play00:05

Здравствуйте товарищи это лаборатория

play00:07

точка сборки с вами Александра Троцкая и

play00:09

Андрей Игоревич масалович он же кибердед

play00:11

Привет Всем здравствуйте Андрей Игоревич

play00:14

Мы уже нени в одном ролике неоднократно

play00:16

говорили про нейросети про умных

play00:18

голосовых помощников типа Алиса и так

play00:20

далее и вроде бы в разрезе шпионажа и

play00:23

утечки данных всё обсуждали Ну вот

play00:26

Хотелось бы более широко скажем так

play00:29

углубиться в эту тему потому что они

play00:32

шагают по миру ничего с этим уже не

play00:34

сделаешь внедрены уже во все сферы и

play00:37

хотелось бы понять Ну например а заметят

play00:40

ли когда-нибудь такие умные Алисы и

play00:43

ипполиты например преподавателей

play00:45

мосгордуму и так далее А расскажи

play00:48

пожалуйста всю историю ну попробуем Да

play00:53

ну первый во-первых голосовые помощники

play00:56

появились довольно давно первый описан

play00:58

5.000 лет назад у древних шумеров вот у

play01:01

них был бог войны нинурта Вот который

play01:04

всех побеждал Почему у него была палица

play01:07

которой он сражался который в нужный

play01:09

момент в тяжёлые моменты битвы начинал

play01:11

человеческим голосом подсказывать что

play01:13

делать хозяину Я вот сейчас был в зоне

play01:15

сво там пример что-то вспомнил мне

play01:17

говорят А у наших начальников такого нет

play01:19

вот многим бы это не помешало чтобы в

play01:23

тяжёлый момент включалось пале с мозгами

play01:26

говорила подсказывала Что делать Вот это

play01:29

не в порядке крити

play01:31

в порядке мечтаний то есть действительно

play01:34

уже была озвучена мечта человечества

play01:36

чтобы был умный подсказчик именно

play01:38

подсказчик вот ну Давайте попробуем

play01:41

мысленно сделать и мы увидим что мы упм

play01:44

в совместное решение нескольких групп

play01:46

задач первая из них которая сейчас

play01:48

кажется мы даже не замечаем самый

play01:50

простой синтез голоса на самом деле

play01:52

заняла дольше всего этим занимали

play01:55

везирова голо

play02:00

это получилось в

play02:03

санкт-петербурге в

play02:07

780 немцы это радуются что это немецкий

play02:11

учёный его зовут

play02:12

Кристиан кранштейн

play02:15

Вот который это сделал действительно

play02:18

сделал это немец Но это был умный немец

play02:20

и когда ему было 25 лет ему Эйлер сказал

play02:23

Слушай ты такой умный те сам Бог велел

play02:26

ехать в Россию вот это как раз место для

play02:29

умных поехал и читал там лекции в

play02:31

академии наук и в он ну немцы считают

play02:35

что он в 1779 придумал это устройство

play02:38

синтеза речи вот на самом деле это

play02:42

была это был конкурс

play02:45

российского Российской академии наук

play02:47

санкт-петербургской Академии Наук

play02:49

конкурс на искусственный интеллект на

play02:52

голосовые помощники короче тогдашней

play02:54

сколкова Придумайте что-нибудь чего не

play02:56

было Вот но у него не очень получилось

play02:59

Элер дал теоретическую основу там вот

play03:02

этих вот звуковых колебаний которые хоть

play03:04

как-то позволяли понять как подступиться

play03:07

вот он сумел сделать железку которая

play03:09

если правильно управляться там была

play03:11

система Мехов вот издавала пять гласных

play03:13

звуков различимых только пять только

play03:16

гласных Ну потому что гласный звук

play03:18

тянется у е но зато мы на слух их могли

play03:21

различить Вот это был реально первый

play03:24

шаста понятно это вообще дожи вот

play03:28

стах остатков изделий чертежей не

play03:31

осталось только словесное описание тем

play03:35

не менее в Дрездене храни реплик то есть

play03:38

по текстовым по текстовым описаниям

play03:41

попытались эту агрегати воспроизвести

play03:43

она действительно получилась она звуки

play03:46

звуки издаёт Вот и в древком музее

play03:50

хранится

play03:52

потом следующий шаг был уже в конце века

play04:01

года была Говорящая голова Иосифа

play04:05

фабера Прим он голову чтобы она издавала

play04:09

звуки делал 7 лет вот а чтобы она

play04:19

шевелилась

play04:20

вот всё вместе делал 25 лет вот

play04:23

собственно подтверждает форму я давно

play04:25

вывел ВС что говорит программист надо

play04:27

умножать на говорит за месяц сейчас запи

play04:30

значит будет зари с небольшим месяца

play04:33

если говорят за 7 лет Ну значит за 25

play04:35

лет

play04:36

справится результат оказался плохим

play04:39

почему он первым столкнулся с эффектом

play04:41

когда у него начало получаться он первым

play04:44

столкнулся с эффектом который вот не так

play04:46

давно описали японцы он называется это

play04:48

само эффект зловещей долины что когда у

play04:50

тебя что-то начинает походить на

play04:52

человека Сначала это выглядит мимимишный

play04:54

всем нравится но когда сходство с

play04:56

человеком к какой-то черте приближается

play04:58

Вот это подсознательный страх и

play05:01

отторжение то есть люди это сторонятся и

play05:03

не используют это как раз излечивается

play05:06

только на самых-самых последних

play05:07

процентах когда уже совсем становится

play05:09

там почти неотличимы от человека Ну с

play05:12

этим готовы мириться вот если видно что

play05:14

это неживое лицо шевелит неживыми губами

play05:17

и при этом издаёт связанные звуки Это

play05:20

только пугает Вот его сын потом пытался

play05:23

на этом бизнес построить он это лицо

play05:25

возил там по разным местам его кстати в

play05:27

Казани показывали в Казанском

play05:28

университете там помоему в 1883 году То

play05:32

есть тоже в России России уже тогда в

play05:34

общем голосовыми помощниками занимались

play05:36

Вот но не очень эффективно значит дальше

play05:40

в шестидесятых

play05:43

годах было такое

play05:45

понятие так называемая лестничная

play05:48

лестничная логика Ну вообще если взять

play05:51

современный компьютер мало кто об этом

play05:52

задумывался и вго Вт увидишь прото

play05:59

внутр увидишь что э схема работает Ну и

play06:01

превращается собственно в компьютер

play06:03

делает осмысленное действие потому что

play06:04

там есть триггера так называемые

play06:06

транзисторы вот в чём идея триггера один

play06:10

сигнал открывает или закрывает другой

play06:11

Сигнал это просто переложение

play06:14

давно-давно известного водяного затвора

play06:17

когда если у тебя где-то протекло можно

play06:19

сделать так что там Нате и перекроет вот

play06:23

и какая-нибудь заслонка Бах ну чтоб

play06:27

спасти от наводнения так вот мало кто

play06:30

задумывался на водяных затвора просто

play06:33

можно сделать вот такую вот водяную

play06:35

лесенку которая будет Ну допустим д

play06:38

числа складывать то есть сюда в виде

play06:41

битов подаёшь водичку она сама она сама

play06:44

вот здесь водичку под одно число там 1

play06:48

там здесь под другое число в конце будет

play06:50

выливаться итоговое число сложение или

play06:52

умножение

play06:54

вот сво

play06:59

ней стали делать имитаторы речи то есть

play07:02

которые там сами подключали или

play07:05

отключали разные частоты Вот то есть ну

play07:08

стали экспериментировать с акустикой вот

play07:10

Ну кстати сказать кто не верит Можете

play07:14

подумать действительно в основе

play07:15

компьютера лежат вот

play07:17

простейшие триггеры где один сигнал

play07:20

короче главная идея что если у меня есть

play07:22

элемент где один сигнал может перекрыть

play07:24

или открыть другой сигнал этого хватит

play07:27

чтобы любую любой алгоритм сделать вот я

play07:32

вас ещё больше огорчу а внутри нейронной

play07:34

сети лежит Нейрон в котором внутри лежит

play07:37

пороговая функция пороговая функция

play07:39

вообще-то это функция которая описывает

play07:43

поведение поплавка на сливном бачке то

play07:45

есть вот вот у него набирается

play07:48

набирается вода он не срабатывает

play07:49

набралась щёлка сработал это чётко та же

play07:52

самая та же самая пороговая функция то

play07:54

есть самый умный это просто миллиард

play07:57

таких сливных бачков собранных собранных

play07:59

вместе интеллекта у него столько же вот

play08:02

поэтому не ждите от него чудес так вот

play08:05

за это взялись японцы сделали систему

play08:08

там был

play08:09

а 71 усилитель там 22 преобразователя То

play08:14

есть она была такая вот ну а так

play08:17

называемую лестничную логику тогда уже

play08:19

активно изучали и это потом перешли уже

play08:22

в такое формальное описание двоичной

play08:23

логики а тогда были тогда схемы

play08:26

описывали такими вот э каскадами

play08:30

и она внятно произносила полтысячи слов

play08:34

на са на японском потом сделали её же

play08:38

сделали на английском Ну и собственно

play08:40

если теперь это такая предыстория вот

play08:42

если не углубляться в Древних шумерах

play08:45

настоящая история началась в

play08:47

1974 году в Штатах там сделали систему

play08:51

она называлась ракс

play08:53

и некий мужик по имени Дональд вот е

play08:58

использовал у него бы паралич лица он не

play09:00

мог говорить реально то есть всё было

play09:01

сделано по-честному то есть он ну в

play09:05

детстве он говорил он мог слышать он

play09:07

понимал как строится речь но говорить

play09:09

технически не мог Вот он на этом

play09:11

устройстве начал названивать заказывать

play09:13

пиццу Ну по получилось Там раза с

play09:16

десятого Потому что сначала просто

play09:17

пугались какой-то неестественный голос

play09:19

что-то там монотонно говорит причём ему

play09:22

довольно долго надо было собирать фразу

play09:24

получалось что его спрашивают он

play09:25

перебивает Ну в общем то есть с тобой

play09:27

разговаривает

play09:29

то что разговаривает робот тогда ещ

play09:31

Представить не могли там сече вот то

play09:34

считали что это какой-то помешанный Но

play09:36

тем не менее он задачу решил то есть он

play09:38

сумел объяснить что надо Надо

play09:41

заказать Вот кстати сказать вопреки

play09:44

распространённом заблуждению

play09:47

заказ заказ продуктов там заказ товаров

play09:51

не самая главная задача для голосовых

play09:54

помощников она На девятом месте На

play09:56

первом месте подбери музычку

play09:59

на вром Какая сегодня погода вот на

play10:02

третьем Включи мне будильник настолько

play10:05

вот ну и так

play10:07

далее бытовые вещи вот подбери купи

play10:10

товар На

play10:12

девятом вот ну и собственно с этого

play10:15

момента стало понятно что вот эта вот

play10:17

Техническая Задача создания речи была

play10:19

решена и даже более того тогда же

play10:20

появилось

play10:22

устройство кото до сих пор можно пить в

play10:24

моди виде дох подат

play10:28

сде котора ребнку понимала 200

play10:31

английских слов которые ребнок

play10:33

произносит неправильно Ну обычно Если е

play10:36

специально не учить Вот И там можно было

play10:39

набрать слово и она его произносила Как

play10:43

его правильно надо произносить вот в

play10:44

качестве такой игрушки детишкам это

play10:46

зашло вот продаётся до сих пор его там

play10:49

100 раз

play10:50

переделывали Вот но до сих пор До сих

play10:54

пор жива

play10:56

называется чит теперь

play10:59

по самим голосовым помощникам как они

play11:03

выглядят сейчас что там

play11:06

используется первое синтез речи синтезом

play11:09

речи ещё до 2000 года

play11:16

наловлю синтезировать сигнал я уже даже

play11:18

как-то рассказывал у меня там в конце

play11:20

девяностых был такой период

play11:22

когда Выяснилось что в России дофига

play11:25

учёных и мозгов вот а в мире делают

play11:28

дофига технических урой которых надо

play11:30

реализовывать непонятные алгоритмы и

play11:32

Возникала Ну идеальная стыковка Вот что

play11:36

тебе непонятно Иди в Россию найдём

play11:38

учёных они тебе сделают Вот я этим с

play11:40

удовольствием занимался мы там кучу

play11:42

задач решали вот Единственное что меня

play11:44

искренне огорчало что каждая группа

play11:46

учёных я им приводил заказчика они

play11:49

получали Первые деньги а дальше там хоть

play11:50

тушкой хоть чучелом Хотели к ним

play11:52

устроиться в команду младшим лаборантам

play11:55

вот я говор блин вы что Ну потратьте

play11:58

один день там изучить основы

play12:00

лицензирования вот вам всю жизнь будут

play12:03

что это закрепите что это алгоритм мой

play12:05

вам всю жизнь будут платить Живи где

play12:07

хочешь там хоть на Мальдивах Те будут

play12:09

идти деньги нет почему-то я хочу вот я

play12:13

такой умный я хочу

play12:14

туда вот ну там несколько случаев было

play12:17

там народ не закреплял тем не менее а и

play12:21

меня тогда тогда в конце девяностых

play12:23

судьба сла с парнем по

play12:25

имений звукооператор от

play12:30

он делал альбом вот и он изобрел

play12:33

устройство которое называлось сивир в ЧМ

play12:36

была

play12:37

идея До этого была одна из ошибок в то

play12:41

что звук - это звук то есть надо ноля

play12:44

Значит надо синтезировать ноля а она в

play12:47

обычной жизни не берётся просто так

play12:50

любой звук берётся Сначала с атаки Но

play12:51

его нет а потом он есть

play12:59

бьёшь по клавише если это музыкальный

play13:01

инструмент и оказалось что во-первых

play13:04

опытный музыкант это слышит что вот это

play13:06

играл это играет мастер А это играет

play13:08

конкретно вот этот А это играет

play13:09

начинающий имен на повод нажать её вот

play13:13

Обычный человек просто если ему показать

play13:16

синтезированный Звук вот с атаками А и

play13:19

показать обычный синтезатор Ну разница

play13:21

колоссальная он не понимает почему но

play13:23

это что-то

play13:25

такое как это сказать суло ид это

play13:27

настоящее Вот и

play13:29

нни тогда собрал собрал огромную

play13:32

библиотеку этих Атак как играет такой

play13:35

инструмент вот в этих этих этих руках на

play13:37

каждую ноту как играет там какой-нибудь

play13:39

большой оркестр там какой-нибудь венской

play13:41

оперы Вот и можно было прям создавать

play13:45

музыку вот не просто из звуков А ещё из

play13:48

подставляя исполнителя Вот это был

play13:50

революция действительно Син Клавир

play13:52

выгнал вобще разрушил сектор нка потому

play13:55

этого быв

play13:59

Я уже рассказывал просто Великая история

play14:03

которую надо 100 раз повторять вот он

play14:05

мне ещ при этом говорил вы Вы айтишники

play14:07

придурки вы не понимаете что нам надо Я

play14:09

говорю Ну и что тебе надо мне нужен

play14:11

накопитель на пол теба Я

play14:14

говорю накопитель вообще-то 40 МБ по киб

play14:18

можно собрать пожалуйста те соберу Но

play14:20

это будет очень дорого это будет больше

play14:22

твоего дома Вот это будет довольно

play14:24

сложно управляться тебе правда это надо

play14:26

не ты ничего не понимаешь это был год

play14:29

девяносто седьмой Угу Вот тебе Вы должны

play14:32

это придумать это должно помещаться у

play14:33

меня в компьютер вот значит я жалею что

play14:37

я за ним не записывал вот потом говорит

play14:39

мне надо чтобы я в экран мог кнуть и там

play14:41

что-нибудь это что-нибудь на экране

play14:43

показать Я говорю В принципе есть

play14:45

устройство у пилотов где он ну на

play14:47

целеуказания может показывать цель Но

play14:51

это вот такой экранчик стоит тоже как

play14:52

сто квартиру не Мне нужен вот такой

play14:54

чтобы я по нему вводил пальцем говор Ну

play14:57

хорошо ты будешь води пальцем Но у тебя

play15:00

программа которая нужна 10 людям в мире

play15:03

никто ради 10 человек не будет делать

play15:06

гот Нет по мени моего слово должна быть

play15:08

программа для каждого грамотного

play15:10

человека Ну то что сейчас называется

play15:12

приложениями Вот я говорю ну таких

play15:14

приложений Ну мы это слово не

play15:15

употребляли таких приложений тогда нуж

play15:17

тысячи он говорит значит будет 000

play15:18

программ Я говорю в мире там всего

play15:22

несколько тысяч программистов

play15:24

кто не Вот вы ВС ничего не понимаете А и

play15:27

самое чем он меня убил Я говорю Ну

play15:29

хорошо ты на экране работаешь Но у тебя

play15:31

же идёт сигнал он уходит сразу ну ты

play15:34

видишь А так называемые эти самые

play15:36

форматы или форматы как она называется

play15:39

долька сигнала это со со секунды Вот

play15:41

сейчас анализ анализ звука когда идёт он

play15:44

делится на по одной сотой примерно А вот

play15:48

оцифровывать значит у тебя сразу уйдёт с

play15:51

экрана он говорит так я должен вот так

play15:52

вот пальцами пальцем значит экран перел

play15:55

Я говорю В смысле ты пальцем вот так

play15:56

двигаешь у тебя по экрану двигается

play15:59

картинку Ну да говорит я говорю Вернись

play16:02

в реальность Ты в каком мире я понимаю

play16:05

что ты там

play16:06

[музыка]

play16:10

задвижкой надо было за ним ходить говори

play16:13

не скажи ещё что-нибудь

play16:15

[музыка]

play16:16

вот это было за за 8 лет до появления

play16:19

Айфона короче первого Айфона вот тем не

play16:23

менее к году главную задачу решили вот

play16:27

звук научились синтезировать более того

play16:30

научились

play16:31

добавлять научились добавлять акценты

play16:33

научились добавлять интонации Ну просто

play16:35

запис собирая Тогда просто собираю

play16:37

большие библиотеки вот сейчас уже

play16:40

сделали мата аппарат под все

play16:43

этапы собственно состоит голосовой

play16:45

помощник он слышит звук делит на

play16:48

короткие короткие дольки эти короткие

play16:50

дольки оцифровывать по ним понимает

play16:52

звуки по ним понимат слова если

play16:55

слово этой Конте Это скорее всего речь

play17:00

там допустим мужчины или там женщины или

play17:04

просто речь человека из России вот

play17:06

пытается то есть дальше он начинает вот

play17:09

этот

play17:10

вот эти собранные данные обогащать То

play17:13

есть если слово непонятно он лезет в

play17:15

словарь какое какое слово скорее всего

play17:18

Эти звуки могут собраться если у него

play17:21

слова начали собираться во фразу но не

play17:23

очень собираются он лезет уже на

play17:26

следующий уровень подсказать

play17:29

Вот таких слов Ну наиболее вероятно

play17:31

собирается вот такая фраза То есть он

play17:32

додумывать ну вернее не росе за него

play17:34

додумывать получается довольно

play17:36

осмысленно Вот то есть условно говоря

play17:38

сейчас вот эта часть задачи решена это

play17:40

хрень понимает что ей говорят Ну вернее

play17:43

может перевести это в текст и кстати

play17:46

одна из задач ради которой это

play17:47

затевалось это люди переводят Кстати

play17:50

номер восем это делают чаще чем то есть

play17:52

надиктовать вот человек говорит в четыре

play17:56

раза больше быстрее чем пишет

play17:58

соответственно многие многим текст

play18:00

удобне не надиктовать Ну и я бы тоже

play18:03

надиктовать Если бы надо было что-то

play18:05

длинно писать вот

play18:08

а И как только вот эту часть задачи

play18:11

решили сразу возникло две ветки одна -

play18:16

это

play18:17

простейший автоответчик который ведёт

play18:20

тебя по простому диалогу без интеллекта

play18:23

Типа если вы хотите вот если вы хотите

play18:27

служить в армии нажмите звёздочку там

play18:28

ходите слушать в армии нажмите решётку

play18:30

Вот то есть там нет интеллекта он тебя

play18:33

ведёт а вот раз второе просто первый

play18:38

прозвон Ну холодный звонок отвечает Не

play18:41

отвечает тут эти ро до слут не дослушать

play18:43

роботы спамеры они кстати составляют

play18:45

более 70% рынка Ну точнее если взять

play18:49

всеми всеми любимых коллекторов вот у

play18:52

коллекторов сейчас 85% первый звонок 85%

play18:57

- это стопроцентный бот то звонит бот и

play18:59

весь разговор вет бот Вот и фиксирует

play19:02

что человек ему сказал оператор просто

play19:04

просматривает выдачу что дозвонился В

play19:07

итоге тот сказал Идите нафиг или сказал

play19:09

там заплачу за месяц то есть Человек

play19:12

читает итог разговора в разговор не

play19:13

вмешивается

play19:14

85% Примерно 15% это когда звонит сам

play19:18

человек ну если случай сложный и только

play19:20

полпроцента это переключение с робота на

play19:24

человека типа там про про ле

play19:29

Дайте мне оператора кстати всем могу

play19:31

сказать Нет могу подсказать я не знаю

play19:34

может быть это уже пофиксили раньше

play19:36

выручала если вот такая хрень мешает

play19:40

поговорить с оператором скажем в банке

play19:41

надо три раза сказать Соедините меня с

play19:44

оператором Она говорит не нажмите тот

play19:46

тот не Соедините меня

play19:48

с на третий раз пробивала ач вот такой

play19:52

ещё вопро говори что когда человеко

play19:55

подобность

play19:57

становится совсем уже ну такого

play20:01

серьёзного уровня то люди свы каются вки

play20:05

Да уже как-то принимают А вот сейчас на

play20:07

самом деле та же Алиса с ней можно

play20:09

пообщаться вполне очень нят некоторые

play20:11

ответы они на самом деле мне не очень

play20:13

нравятся оже звучат так как я тебя тут и

play20:17

всех немножко огорчу там использовано

play20:20

несколько механизмов Ну вернее там

play20:23

использовано много механизмов это чтобы

play20:26

речь стала внятной и человеко подобный

play20:29

часть из которых по смыслу плохие вот Ну

play20:32

первое главный механизм вот то что

play20:34

называется gpt генеративный генеративный

play20:37

тренированный трансформер Вот это

play20:40

идеальный подсказчик наиболее вероятного

play20:43

продолжения фразы он не понимает О чём

play20:44

фраза Он просто знает что если говорят

play20:46

Барак скорее всего Обама вот не более

play20:50

Вот и если говорят Иди на то дальше один

play20:53

из некоторых небольшого числа вариантов

play20:56

Вот то есть это такой подсказчик не

play20:58

ведёт смысла раз второе тоже печалька

play21:01

которая делает оживляет разговор это так

play21:04

называемая СКС короткие Разговоры это

play21:07

шаблон наиболее типовых вопросов типовых

play21:10

типовых коротких ситуаций в разговорах

play21:12

под которые я вас огорчу ответ подбирал

play21:15

человек вот и когда нам кажется что

play21:18

робот шутит это заранее подобранный вот

play21:21

и третье Самое печальное вот что сейчас

play21:24

На чём нарыва это если идт неко кова

play21:29

которого уже ловится что сейчас была

play21:33

Ирония вот или сейчас там надо пошутить

play21:36

или сейчас мы пошли вот в эту тему он

play21:38

дальше запускает ча G5 уже с некоторыми

play21:42

сужающий ками на самом деле когда вы

play21:44

разговори сейчас п у этой хрени довольно

play21:46

много команд которыми можно по управлять

play21:48

А скажи мне что-нибудь Академическое

play21:50

Скажи мне теперь что-нибудь там разговор

play21:53

А теперь

play21:54

Пошути и вот в такие места встав взять

play21:58

из книжек взять из там фильмов причём

play22:01

Вот таких взять там из сериалов для

play22:03

домохозяек Похоже что речь идёт Ну

play22:06

разговор идёт с домохозяйкой ей зайдёт

play22:08

вот ссылочка на такие книжки или там на

play22:11

такую музыку Вот и к сожалению часть

play22:15

таких диалогов тренировали на либо на

play22:18

непроверенных там данных из книжек или

play22:21

сериалов либо вообще на сырых данных Ну

play22:23

вот на чём грохнулся первый же 51 его

play22:26

тренировали на данных в которых были на

play22:28

с вами диалоги поэтому он там ругал

play22:31

хвалил Гитлера там ругал евреев вот

play22:33

ругал негров и прочих вот и ну недавний

play22:37

случай там совсем такой вопиющий когда

play22:41

десятилетняя девочка сказала Алиса там Я

play22:44

хочу раз мне скучно Развлеки меня Алиса

play22:47

говорит я тебя научу Возьми Возьми

play22:49

устройство то азон было по-моему Это

play22:52

по-моему было у Алексы а ой да чуть не

play22:57

обидел

play23:02

уну бы нашла вот да не Алиса у Алекса

play23:07

Короче она ему

play23:10

посоветовала возьми зарядник наполовину

play23:13

Вынь из розетки чтобы были видны

play23:15

контакты и положи на контакт и положи на

play23:18

контакты монетку в общем скучно не будет

play23:20

Вот ну могу сказать там вероятность 50

play23:22

на 50 с 50 с вероятностью 50% при этом

play23:25

конкретно долбанёт с вероятностью 50%

play23:27

Это вся превратится локальную зажигалку

play23:30

Вот Ну а дальше уже зависит от того что

play23:32

рядом попадёт вот то есть это была

play23:35

правда большая разборка на эту тему Вот

play23:38

то есть ну это не единичный случай на

play23:40

самом деле довольно часто Ну вот уже

play23:42

нашу родную Алису тут уже не перепутаешь

play23:44

её заносило с Машей и Медведь как раз мы

play23:47

даже в этих стенах похожую тему

play23:50

обсуждали что Маша - это призрак девочки

play23:53

которую когда-то Медведь

play23:55

сожрал Вот она теперь как бы изображает

play23:58

совесть да А правда что есть специальные

play24:02

люди которые обучают вот этих помощников

play24:05

эксперты скрипто А

play24:09

их даже три типа вот да людей там много

play24:13

первое к сожалению в очень многих

play24:16

случаях всё-таки сзади сидит человек и

play24:19

рулит то есть очень много алгоритмов ещё

play24:22

сопровождаются ручной или работой или

play24:24

хотя бы подстраховкой ну то есть за

play24:27

работой сети следи человек это раз а

play24:30

второе в процессе

play24:33

обучения фактически на вот такую вот

play24:36

лобовую работу Трансформера что увидишь

play24:38

это отвечай так увидишь это отвечай так

play24:41

накладывается семантическая сеть её

play24:43

накладывает человек что вот здесь идёт

play24:45

речь про погоду надо посмотреть сюда вот

play24:48

здесь речь идёт там про войну надо взять

play24:50

отсюда вот то есть сама настройка ещё

play24:54

сверху накрыта алгоритмами Ну такими вот

play24:57

как бы тропиночка прописанными вручную

play24:59

Вот и эти Ну часть из них никуда не

play25:02

денешься там что такое хорошо что такое

play25:04

плохо это этично неэтично там можно

play25:07

можно детям нельзя детям это всё вот эти

play25:09

вот рамочки ставляет человек там мат не

play25:11

мат и так далее Вот это вторая сторона

play25:14

Ну и третья сторона сама

play25:17

сеть Это готовая с которой мы

play25:20

разговариваем это тоже продукт у

play25:22

которого очень много команд управления

play25:25

точно так же как поисковик это очень

play25:27

сложно внутри система Ну с невообразимо

play25:30

огромной базой у которой есть язык

play25:32

управления это язык запросов Если вы

play25:35

просто набираете запрос Без команд вот

play25:38

выдача будет сырая Если вы научитесь

play25:40

пользоваться Ну когда-то у меня вот

play25:42

семинары конкурентная разведки

play25:44

начинались именно с этого что за полдня

play25:47

можно научить любого человека там

play25:49

неважно начальника или как мои

play25:50

программисты говорят полного начальника

play25:52

вот или секретаря вот искать в интернете

play25:55

вче раза быстрее просто правильно

play25:57

употребля

play25:59

Ну понима немножко логику работы вот

play26:00

сейчас это стало отдельным направлением

play26:04

вот оно называется промпто вот или

play26:08

по-русски стали называть же патологи

play26:11

специалисты по gpt и к моему глубокому

play26:17

разочарованию сейчас всерьёз обсуждается

play26:20

ввести же патолого как специальность

play26:22

потому что считают что через 3 года их

play26:24

понадобится много что этому надо учить в

play26:27

университетах ребята не надо это учить в

play26:30

университетах это достаточно

play26:33

[музыка]

play26:39

одномерных же патолого придётся

play26:41

переучивать потому что большая часть

play26:43

косяков научатся снимать на

play26:45

подлёте сетки сами будут разбираться вот

play26:49

а те которые не научатся С ними надо

play26:52

будет по-другому управляться хорошо наша

play26:54

любимая тема захватит ли мир искусствен

play26:56

интеллект

play26:59

уже поняли что нет не захватит ты уже не

play27:02

раз об этом говорил но и всё-таки если

play27:06

уже есть какая-то технология которую

play27:08

можно визуализировать то есть Аватар

play27:11

который говорит общается слушает и так

play27:13

далее А

play27:15

эти системы заменили ведь многих

play27:18

сотрудников тех же да колл-центров там

play27:20

этих операторов и так далее вот

play27:22

преподавателя преподавателя в школе или

play27:25

в институте когда-нибудь заменят такая

play27:27

веь

play27:28

не заменит потому что нужна обратная

play27:30

связь преподаватель должен настраиваться

play27:33

Ну вот реально ну только что называется

play27:36

учитель там только не в нашем смысле а

play27:38

вот из этих всяких восточных фильмов там

play27:41

скажи учитель Вот учитель или там в

play27:43

Штатах это называется тьютор вот человек

play27:46

который настроен на то чтобы передать

play27:49

знания и он Ну всё время как струна он

play27:52

слышит где он не договорил где его

play27:54

недопоняли где там чело сби Вот это Вот

play27:58

это отсутствует начес то есть здесь

play28:00

проблем Ну есть несколько проблем при

play28:03

как это внедрить в обучение главное

play28:05

следующее Первое это правда надо Вот И

play28:10

там те кто те кто спорит что это только

play28:12

ухудшит они отчасти не правы Потому что

play28:15

есть случаи где электронное обучение

play28:16

нужно Ну где просто не хватает учителей

play28:18

в каки дальних аулах вот там это

play28:21

выручает Ну где нет ничего можно

play28:23

включить но правда с тем же успехом

play28:25

можно Youtube включить профильную лекцию

play28:27

послу

play28:29

раз вторая

play28:31

проблема очень качественный Аватар

play28:35

качественное общение стоит очень дорого

play28:38

То есть можно сделать персонального

play28:40

помощника Но это будет какие-то ломовое

play28:42

деньги и на оборот простейший диалог Ну

play28:46

также Вот наверняка надо будет наверно

play28:47

отдельный ролик сделать про пластмассу

play28:49

Сейчас ровно тоже самое происходит что

play28:51

было с изобретением пластмассы на

play28:54

демоверсия революци можно любую задачу

play28:57

решать лю ло любая там форма любой цвет

play29:00

ну классно пластмасса всё изменит мир

play29:02

вот на самом деле она была в руках

play29:04

одного кстати довольно жадного

play29:06

англичанина который тупо лепил там самый

play29:10

дешёвый целу лойт В итоге сам разорился

play29:12

весь мир отпугнуть пластмассы и только

play29:14

через 50 лет Выяснилось что блин если

play29:16

каждую задачку облизывать вот как

play29:18

следует каждую задачку можно решить Но

play29:21

если пытаться найти универсальное

play29:24

решение это будет дешёвый целу ничего

play29:27

более вот сейчас та же самае то же самое

play29:29

с искусственным интеллектом то есть

play29:31

очень дёшево очень легко сделать

play29:33

массовое решение Но это будет дешёвый

play29:34

целы лот очень дорого и сложно сделать

play29:37

точечно Ну я сам в одном проекте

play29:39

участвовал правда после со По

play29:42

естественным причинам закрылся потому

play29:44

что у нас партнёры были израильтяне они

play29:46

как-то поняли что сейчас не то время вот

play29:48

мы делали систему которая называется

play29:50

Легина

play29:52

вот личную помощницу медсестру которая с

play29:55

пожилым человеком может поговорить

play29:57

позвонить

play29:58

детям рассказать что у бабушки ВС в

play30:00

порядке померить там всякие показатели

play30:03

давления подсказать таблетки вызвать

play30:05

скорую если надо там Если ещё к ней

play30:07

подключить простейшее устройство ещ укол

play30:10

самое бабахает вовремя вот цифрового

play30:13

депутата можете делать стате как хорошо

play30:16

Какие

play30:20

задачи

play30:22

корупции по во по

play30:28

зада рада

play30:34

поть на этом надо сворачиваться Если я

play30:37

сейчас начну развивать тему Во что

play30:39

превратится электронный депутат Ну могу

play30:43

Давай закончим на старом старом примере

play30:45

во-первых слово кибернетика вводили как

play30:48

идеальное управление государством на

play30:50

основе современных

play30:59

точнее ещ в Советском

play31:02

Союзе чудесную книжку написал академик

play31:05

Моисеев первый директор этого самого

play31:08

вычислительного центра Академии Наук вот

play31:10

он написал что они начали у них

play31:12

появились компьютеры Вот они навчились

play31:15

моделировать разные процессы очень

play31:16

внятно очень классно которые до этого

play31:19

которым не могли подступиться и решили

play31:22

что пора заняться народным хозяйством

play31:23

очень дого с этой иде

play31:26

возились луко который придумал систему

play31:31

идеального российский интернет и

play31:33

идеальное управление на основе такой

play31:35

распределенной системы Интернет подобной

play31:38

системы управления Так вот в итоге

play31:40

Моисеев описывает что их послушали Им

play31:42

дали в

play31:43

управление са автобазу на окраине Москвы

play31:46

они за 3 месяца её разнесли в муку вобще

play31:49

в ноль Вот потому что как

play31:52

оказало

play31:56

с рошо Что такое хорошо Ну допустим вам

play32:00

надо увеличивать в плане тон на

play32:03

километра Да запросто берёшь любой груз

play32:05

там два Круга по МКАДу вот те тон на

play32:07

километра Или надо уменьшать время

play32:10

доставки вот она на раз вычисляет

play32:13

оптимальное время доставки ставишь его в

play32:15

план Всё ты план завалишь потому что

play32:16

здесь Светофор сломался здесь ремонт

play32:19

дороги Здесь авария Вот и идеальное

play32:22

время не вытащишь вот ну и так далее

play32:26

Короче мы пока не готовы В общем Итак

play32:29

первое голосовые помощники есть даже в

play32:31

большем количестве чем надо Кто хочет

play32:34

заработать или изменить мир надо брать

play32:36

одну локальную задачку с одним портретом

play32:39

заказчика его вылизывать сколько можно

play32:42

это будет дорого но зато это будет круто

play32:45

вот к сожалению могу предсказать Что нас

play32:47

ждёт сейчас наоборот обилие дешёвого

play32:50

такого целлулоида для всех Вот тем не

play32:53

менее рынок в России кстати в мире он

play32:55

растёт на 15 на 19% прогнозируется на

play32:58

ближайшие 3 года в России на 40 тире 80

play33:01

то есть хотите зарабатывать на этом

play33:03

секторе бабки едите в Россию Спасибо

play33:06

Андрей Игоревич а подписывайтесь на

play33:09

канал точки сборки и клуб Кибер дедом

play33:11

ссылки будут в описании Ну и всем доброй

play33:16

охоты Добро пожаловать в мир

play33:18

прогрессивных решений и надёжных

play33:21

партнёров Аврора представляет компанию

play33:24

актика меняющую правила в мире оконного

play33:27

сервиса ИС следующую тем же ценностям

play33:30

что и коллектив нашего информационного

play33:32

агентства актика - это новое слово

play33:35

остекление объектов любой сложности

play33:38

прямая связь с руководителем честность

play33:41

Надёжность и открытость команды которого

play33:43

меняют индустрию установки окон

play33:46

предлагая двойной срок службы

play33:48

конструкций по цене прошлого года

play33:50

Пригласите для расчёта стоимости

play33:52

специалистов трх компаний и вы Пойте

play33:55

Почему окна актика доступнее кажутся А

play33:58

гарантия 10 лет не единственное

play34:01

преимущество соблюдения нами всех

play34:03

строительных норм и правил акно надёжно

play34:07

доступна в срок ссылка в описании

play34:12

[музыка]

Rate This

5.0 / 5 (0 votes)

Related Tags
голосовые помощникиискусственный интеллектИстория технологийнейросетисинтез речиАватар AIобразованиемедицинакибернетикамаркетингобучение AI
Do you need a summary in English?