Адмирал Преподаватель
В эти выходные мы приняли активное участие в DHhack - хакатону для школьников и студентов по созданию ИТ проектов и исследований в области гуманитарных наук, организованном компанией КРОК. Ростислав выступил на хакатоне в качестве технического эксперта от Геккона, а две команды наших учеников приняли участие в основном зачете. Забегая вперед - в этот раз у нас не получилось взять призовое место, но мы получили много полезного опыта, и, кажется, продвинулись в умении работать в команде и создавать работающие решения. Но обо всем по порядку...
В начале хакатона участникам были предложены несколько задач, которые можно выбрать для проработки, либо взять полностью свою тему. В частности, например, можно было заняться созданием бота, который бы разговаривал в стиле известных писателей (ТолстоБот), заняться визуализацией данных об активности исторических личностей на карте, давать автоматические толкования устаревшим словам (предварительно определив, какие из слов устарели) или заняться исследованием эвфемизмов в тексте. В общем и целом, много интересных идей как области компьютерной лингвистики, так и машинного обучения.
От нас в соревновании приняли участие две команды - Ok (Петя, Сережа, Тихон, Артур и Данила) и ZA WARUDO (Вова, Никита, Святослав и Донир). И в этом раз у обоих команд получилось создать действительно работающие продукты.
Команда Ok занялась анализом устаревших слов в тексте. В итоге у ребят получился плагин к Google Chrome, который автоматически находит устаревшие слова на произвольном сайте и превращает их в ссылке. При клике на ссылку отображается определение этого слова из викисловаря или википедии. Чтобы понять, какие слова устарели, ребята придумали сравнить частнотность слов в корпусе текстов классической русской литературы и корпусе современных произведений. Если слово встречалось в классике гораздо чаще, чем в современных текстах - скорее всего современный читатель может про него не знать.
Что получилось - можно постреть на гите https://github.com/MrFzovpec/deepPast.
А ребята из ZA WARUDO решили взяться за собственную идею - на основе данных Google Places API и постов из ВК определять рентабельность бизнеса в конкретном месте Москвы. В итоге получился веб-сервис, который просит ввести тип бизнеса и возраст целевой аудитории, а затем строит тепловую карту Москвы, помечая зеленым места, в которых мало конкурентов, но много людей. Количество людей в данном случае считается на основе количества фотографий в ВК, сделанных в радусе этого сектора карты (эти данные для открытых страниц можно получать через ВК апи, что собственно, ребята и сделали).
Оба технических решения отлично работали, но по итогам презентации на немного обошли другие сильные решения. В номинации лучшее техническое решение от школьников в этот раз одержала победу команда Run, которая представила интерактивную карту мнений в Москве: можно было выбрать тематику постов, и система отображала на карте Москвы области, в которых люди пишут об этом. На презентации система отлично отработала как с Кремлем (указав два кремля), так и с митингами. Данные в этом случае ребята так же брали из поиска ВК апи.
А в номинации лучшее креативное решение победила команда Meh, реализовавшая сервис по автоматической замене грубых слов на эвфемизмы. Креативным здесь был способ, котором ребята решали задачу: анализировался контекст и частотность слов в корпусе русской классики и субтитров к фильмам Квентина Тарантино.
P.S. По итогам хакатона в магазин добавятся несколько футболок, стикеры и браслеты с хакатона, а еще, чтобы подтянуть навыки питчинга, начиная с этого воскресенья мы периодически будем проводить мини кейс-чемпионат. Подробнее - https://geekclass.ru/insider/events/43. Будем рады гостям!