Стрічці новин в Telegram бути

Протягом останніх кількох місяців в адмінських колах поширюються чутки про досить цікаве нововведення Telegram. Всі говорять про стрічку новин, але достовірних і точних даних ні у кого не було.

І ось, 18 листопада, на сайті contest.com виходить новий конкурс для розробників — Перший раунд конкурсу кластеризації даних. Хто не знає, цей сайт команда месенджера зробила спеціально для проведення подібних конкурсів. Бюджет на розробку алгоритму більше 200 000 доларів, по 100 тисяч на кожен раунд. З одного боку досить щедро, а з іншого — це гарантія того, що нововведення точно буде. Не буде ж Дуров просто так викидати стільки грошей, щоб побавитися.

Отже, ми порилися в умовах конкурсу і можемо виділити кілька моментів, які точно будуть в майбутніх оновленнях. Давайте пройдемося по всіх.

Виділення текстів російською та англійською мовами

Алгоритм повинен виділити всі англо- і російськомовні тексти, інші мови не є релевантними для даного етапу конкурсу.

Що нам сподобалося в цьому моменті? А те, що російськомовний сегмент для Дурова один з найбільш релевантних. Тобто, можна з упевненістю сказати, що в разі блокування, Telegram буде «боротися» до останнього.

Відділення новин від інших матеріалів

Алгоритм повинен залишити в списку лише новини, відсіявши сторонні тексти, енциклопедичні та довідкові матеріали і т.д.

У стрічку будуть збиратися дійсно новини, алгоритм зможе відсівати різні статті. Можливо буде відслідковуватися актуальність новин. Найбільші охоплення отримуватимуть ті, хто працює оперативніше усіх.

Групування новин по тематиці

Алгоритм повинен розподілити новини за наступними 7-ми тематиками:

— Society (включає Politics, Elections, Legislation, Incidents, Crime)
— Economy (включає Markets, Finance, Business)
— Technology (включає Gadgets, Auto, Apps, Internet services)
— Sports (включає E-Sports)
— Entertainment (включає Movies, Music, Games, Books, Arts)
— Science (включає Health, Biology, Physics, Genetics)
— Other (новинні статті, що не потрапили в перераховані вище категорії)

Можна буде підписуватися на певні тематики новин. Якщо ви займаєтеся мистецтвом і відстежуєте новини по своїй темі, то вам не будуть потрапляти новини політики. І це не може не радувати. Також можна простежити якийсь пріоритет новин для команди месенджера по їх порядку в списку.

Групування схожих новин в сюжети

Алгоритм повинен згрупувати новини, написані про одну подію/ інфопривід/сюжеті, вибравши загальний заголовок для групи новин. Новини всередині сюжету повинні бути відсортовані по релеватності.

Дуже крута штука, якої не вистачає всім новинним каналам. Тепер всі новини по одній темі, будуть збиратися в одну категорію і їх можна буде розглянути з різних сторін. Тобто подивитися на одну і ту ж подію під різним кутом, або оцінити ситуацію максимально повноцінно.

Ранжування сюжетів

Алгоритм повинен сформувати списки сюжетів по тематиках, відсортовані за важливістю. Крім того, потрібно сформувати відсортований по релеватності список сюжетів незалежно від тематики.

Тут особливо коментувати нічого, цей пункт покращує навігацію по сюжетам в рубриці, а також збирає найбільш важливі сюжети в стрічці всіх новин.

Висновки

  1. Стрічка новин буде, і це не може не радувати
  2. Можливо буде внесений новий подих життя в напівмертві, забуті або занедбані новинні канали, але це не точно.
  3. Поки не відомо, чи буде це окремий сервіс, або стрічка буде вбудованою в телеграм. Якщо стрічка буде вбудованою, то ми припускаємо, виглядати вона буде як розділ «Архіви».
  4. Також не відомо звідки буде братися контент для стрічки. З каналів, сайтів, зі статей в Telegraph або звідусіль.
  5. Якщо новини будуть братися з каналів, то як потрапити в цю вибірку, також поки не зрозуміло.