Как сравнить 2 текста между собой на уникальность?

leon4891

Итак, есть книга, в которой 5 глав. Может так случиться (и, как показала практика, случается что некоторые отрывки по паре-тройке строк (а может и пол-страницы) могут повториться и в 1й, и в 4й, к примеру, главе. Есть ли прога, которая это дело вычислит и покажет, где повтор? Спасибо. Инет сходу только по длине шинглов выдает результаты, и в лучшем случае пишет только процентное сходство, а мне нужно именно конкретные куски повторные найти в 1й главе и 2-5, во 2й и в 3-5 главах и т.д.. Rebel_yv что-то такое спрашивал, помнится, но тред не могу найти + там вроде не совсем по моей теме было...
ShinglesExpert как раз только проценты и выдает, к тому же не большой объем текта пишет ошибку "Аccess violation at address..."

stm7543347

Зависит от формата текста.
diff, например.
Алсо такое в ХнС спрашивают.

fass965

Есть ещё графические diffuse, k3diff, я ими предпочитаю пользоваться - нагляднее намного.
Вообще заглавие несостыкуется с содержанием поста. В заглавии вроде как сравнивать надо 2 файла, а в содержании речь идёт о поиске повторов в одном тексте. Или у тебя повторы могут быть только в разных главах, а пределах одной - невозможны?
Я вот думаю, что стандартный diff как раз таки не подойдёт для сравнения обычных текстов, поскольку сравнивает построчно, а вот diffuse вполне себе может подойти, потому как выделяет сходства-различия и внутри строк.
+1 по поводу неверного выбора раздела

leon4891

Понятно, спасибо, попробую. Текст в ворде. Да там в каждой главе оригинальный текст, вряд ли будут повторы внутри глав. В Стади думала запостить, а про ХиС вообще забыла, сорри :o

Banzay1

я в ворде сравнивал

peleev

ждём баш скрипт от unkulunkulu !

starmaster

В 2007-м на вкладке Рецензирование есть Сравнить.
В 2003-м тоже где-то там же, но в меню.

peleev

давай текст в текстовом виде - сравню
Оставить комментарий
Имя или ник:
Комментарий: