(no subject)
May. 7th, 2026 09:38 pmМы с женой регулярно слушаем, среди всего прочего, подкасты на иврите "Гикономи" - ведёт их стартапер, который делает это для удовольствия т.к. основной заработок у него уже есть. Гости там совершенно разные от политиков до пчеловодов. Однако лёгкий тон беседы и любознательный ведущий делают своё дело.
И вот пару недель назад, одним из гостей подкаста оказался ливанский араб-христианин, живущий в Израиле. Разговор вышел особенно любопытным, так как был откровенным, касался межконфессиональных отношений и даже геев (коим являлся гость эпизода) в арабских странах. Жена посетовала на то, что её коллегам было-бы классно послушать такое, ведь они регулярно расспрашивают её на околоизраильские темы зная, что она охотно старается на них отвечать. А тут такой богатый этнографический материал!
Автогенерированные субтитры на английском в ролике на Ютюбе были ужасными, да и никто не будет столько читать. Нужен аудио формат. Процесс боль-менее понятен: распознать ивритскую речь в текст, перевести записанный диалог на английский и переозвучить его на два голоса. Проблемы вылезли в деталях, как всегда. Интервью шло в неформальном тоне, и собеседники регулярно друг-дружку перебивали. Более того, использовались куча общепринятых среди израильтян сокращений, и стандартная распознавалка как Антропика так и OpenAI с транскрибированием исходника на иврите справились на тройку. Переводить такое было ещё нельзя. Друг подкинул идею с assembly.ai который выполнил работу на пятёрку с минусом. Потом я поэкспериментировал с подбором голосов для озвучки, темпом, тембром и сгенерировал конечный результат. Полтора часа исходного подкаста на иврите превратились в 2 часа приглаженной беседы на английском.
И только на последнем этапе до меня дошло (увы), что разговор основан на таком количестве средневосточного контекста, что не-израильтянину такое слушать, даже на родном языке, будет непонятно: ЦАДАЛЬ, джизья, муэдзин, имена местных политиков, свободное упоминание дат которые очевидны для израильтянина, но ничего не говорящие американцу фразы "между сорок восьмым и шестьдесят седьмым", и т.п.
Подкинул для тестирования на прослушку младшему, посмотрим...
И вот пару недель назад, одним из гостей подкаста оказался ливанский араб-христианин, живущий в Израиле. Разговор вышел особенно любопытным, так как был откровенным, касался межконфессиональных отношений и даже геев (коим являлся гость эпизода) в арабских странах. Жена посетовала на то, что её коллегам было-бы классно послушать такое, ведь они регулярно расспрашивают её на околоизраильские темы зная, что она охотно старается на них отвечать. А тут такой богатый этнографический материал!
Автогенерированные субтитры на английском в ролике на Ютюбе были ужасными, да и никто не будет столько читать. Нужен аудио формат. Процесс боль-менее понятен: распознать ивритскую речь в текст, перевести записанный диалог на английский и переозвучить его на два голоса. Проблемы вылезли в деталях, как всегда. Интервью шло в неформальном тоне, и собеседники регулярно друг-дружку перебивали. Более того, использовались куча общепринятых среди израильтян сокращений, и стандартная распознавалка как Антропика так и OpenAI с транскрибированием исходника на иврите справились на тройку. Переводить такое было ещё нельзя. Друг подкинул идею с assembly.ai который выполнил работу на пятёрку с минусом. Потом я поэкспериментировал с подбором голосов для озвучки, темпом, тембром и сгенерировал конечный результат. Полтора часа исходного подкаста на иврите превратились в 2 часа приглаженной беседы на английском.
И только на последнем этапе до меня дошло (увы), что разговор основан на таком количестве средневосточного контекста, что не-израильтянину такое слушать, даже на родном языке, будет непонятно: ЦАДАЛЬ, джизья, муэдзин, имена местных политиков, свободное упоминание дат которые очевидны для израильтянина, но ничего не говорящие американцу фразы "между сорок восьмым и шестьдесят седьмым", и т.п.
Подкинул для тестирования на прослушку младшему, посмотрим...