Новость про землетрясение в Лос-Анджелесе написал… бот

Кен Швенке журналист и программист из LA 17 марта проснулся утром от того, что в Лос-Анджелесе случилось землетрясение.

Но ему не нужно было писать новость на эту тему, потому что заметка была уже готова в его компьютере, оставалось только нажать кнопку «опубликовать».

Задержка между событием и появлением первой новости о нём составила порядка 3 минут.

Информация о землетрясении поступила из центра мониторинга сейсмической активности, а заметка была написана с помощью алгоритма, который создал Кен Швенке.

Алгоритм называется Quakebot. Он был написан Швенке два года назад. Схема работы алгоритма простая: информация из центра мониторинга попадает в систему, система анализирует данные и вставляет их в заранее заготовленный шаблон.

Английский текст новости выглядит следующим образом:

A shallow magnitude 4.7 earthquake was reported Monday morning five miles from Westwood, California, according to the U.S. Geological Survey. The temblor occurred at 6:25 a.m. Pacific time at a depth of 5.0 miles.
According to the USGS, the epicenter was six miles from Beverly Hills, California, seven miles from Universal City, California, seven miles from Santa Monica, California and 348 miles from Sacramento, California. In the past ten days, there have been no earthquakes magnitude 3.0 and greater centered nearby.
This information comes from the USGS Earthquake Notification Service and this post was created by an algorithm written by the author.
Read more about Southern California earthquakes.

Бот не только опубликовал новость, но и отправил её в твиттер:

Это, кстати, не единственный бот, который трудится в LA Times. Кроме сообщений о землетрясениях, скрипты сообщают читателями новости об убийствах, которые происходят в городе. Этот бот трудится над проектом Homicide.

Homicide

Текст новости не то чтобы достойно Пулитцера (да это и не требуется!), но сам факт того, что подобные новости, не требующие особых литературных навыков, а призванные просто донести какую-то простую фактическую информацию до аудитории, можно делать автоматически, очень крутой.

При этом на лицо преимущества такой технологии: освободившиеся руки и мозги журналистов, которым нужно было делать эту работу.

Бен Уолш, отдел баз данных в LA Times:

— Вы можете написать код, который задаст и получит ответы на те же простые вопросы, которые будет задавать журналист при написании материала на ту же тему.

Для чего может использоваться эта технология? Спортивные результаты, данные с фондового рынка, полицейские репортажи, какая-то статистика от органов власти или администраций разных уровней.

При этом, согласно исследованию шведского академика Кристера Клервола, читатель крайне редко может отличить материал, написанный с помощью алогоритма, от «человеческого» текста.