В США закончился конкурс с восстановления измельченных документов
Победители соревнования по реконструкции текстов, пропущенных через шредер, стали известны гораздо раньше, чем ожидалось. Чемпионы-детективы проявили находчивость и смекалку.
Победители соревнования по реконструкции текстов, пропущенных через шредер, стали известны гораздо раньше, чем ожидалось. Чемпионы-детективы проявили находчивость и смекалку.
Конкурс который стартовал в конце октября с воспроизведения измельченных документов Shredder Challenge завершен. Первое место и призовые $ 50 тысяч завоевала команда программистов из Сан-Франциско под названием «Все ваши обрезки принадлежат США». Она быстрее и точнее соперников собрала все пять пазлов, то есть документов, разрезанных в общей сумме на 10 тысяч тонких полосок. И еще она первой ответила на связанные с загадками вопросы относительно городов и людей, которые упоминаются в текстах.
На фото: Оригинальный и реконструированный победителем текст номер 1. Он был разбит всего на 224 кусочка (далее степень измельчения пазлов шла по нарастающей), поэтому данный бумага команда собрала уже 6 ноября.
Ключом к успешному решению задачи оказалось сочетание чисто машинного подхода (сортировка и сравнение фрагментов) с творческой работой людей-сборщиков, сообщает агентство устроило конкурс. Программа-победитель подбирала отсканированные кусочки бумаги друг к другу, а потом предъявляла пары для проверки членам команды. Последние не просто по буквам отслеживали верные сочетания соседних полосок, а использовали по ходу восстановления документов разбросаны по ним подсказки, то есть обращали внимание на содержание головоломок.
На фото: Загадка номер пять была самой сложной во всей серии. Здесь было разбито и перемешано сразу три листа бумаги (на фото изображен только третий — до измельчения и после восстановления).
Один из трех листов был порван в направлении, перпендикулярном к двум другим, а общее число кусочков составило более шести тысяч! К тому же небольшая часть текста была морзянкой в виде нагромождение повторяющихся слов «dit» и «dah». Над этой головоломкой команда победителей колдовала до 29 ноября.
На фото: Документ №3.
Собрав третий документ, участники должны были назвать судьям задуманное в загадке город — Сьенфуэгос. Интересно, что непосредственно в документе этот город не упоминался, зато там были указаны географические координаты Гаваны, нарисованы контуры Кубы и дан набросок очень известного городского парка Сьенфуэгос.
При выборе победителя учитывалось не только первенство в составлении пазлов. За те или иные правильные ответы на вопросы по содержанию документов судьи начисляли дополнительные баллы. Группа победитель оказалась лучшей не только в деле программирования, но и просто эрудиции, сообразительности.
На фото: Задача номер два. Умеренное число обрывков — всего 373 — позволило победителям восстановить этот документ быстро и практически на 100%
Свое последнее решение задачи из серии задач команда из Сан-Франциско прислала всего через 33 дня после анонса конкурса. На составление алгоритма машинного зрения и сортировки обрывков, а также на составление бумаг умельцы потратили 600 человеко-часов.
Победители не только опровергли все прогнозы, но и наглядно показали, как с измельченной мешанины бумаг можно извлекать читабельный текст и разбираться в его содержании даже при недостатке частей документа. Но ведь именно это и было нужно инициаторам конкурса, который представлял интересы военных и спецслужб.
На фото: Четвертый пазл (порезанный на 2340 кусочков) подвергся победителям лишь частично. Но и восстановленных фрагментов хватило для того, чтобы узнать «имена ученых, которые работали над «секретным проектом»