|
ru.perl- RU.PERL ---------------------------------------------------------------------- From : Serge Chervjakov 2:5020/400 13 Sep 2004 06:42:16 To : Artem Chuprina Subject : Re: Поиск похожего? --------------------------------------------------------------------------------
Mon Sep 13 2004 01:51, Artem Chuprina wrote to Ivan Frolkov:
AC> веселым примером тут будет Городницкий, впервые услышанный по телефону
AC> (мы помним, что база не занимается семантическим анализом?). (Почему он
AC> мне вспомнился? Потому что его вечно Александром Михайловичем норовят
AC> обозвать.) Первый звук, в отличие от "ч", может вообще с легкостью
AC> пропасть, может быть "г", может "к", может "х". Вторая звук -
AC> безударный. Там может быть "а" или "о". "Р" ладно, его трудно
AC> спутать. Затем "а", "о", "э" или "ы". После "р" выбор богаче, чем
AC> после "г". Затем "д", "т" или ничего. "ь" или ничего. "н". "и". "ц",
AC> "с", "тс". "к" или "г", в принципе опять возможна "х". "и", в ряде
AC> произношений может быть похожа на "о" или "а". "й" или ничего.
Хм.. там вроде речь не о произношении шла, а об опечатках:). Уж если кто-то
при вводе вместо Городницкого введет Гараднитскаго, то ему уже ничего не
поможет - наверняка есть существующие фамилии более близкие к Гараднитскому,
чем "расстояние" от Гараднитскаго до Городницкого... А потому при поиске надо
забивать на фонетический анализ (пробовать для начала сливать буквы th в s или
наоборот), а сразу искать наиближайшее похожее по разнице в буквах.. А вроде
тот модуль, что писался первыми из ответов этим и занимается? И проблема
только в русских буквах? Вот интересно почему ЭТА проблема возникает.. а с
фонетикой компам рано еще разбираться, ну по крайней мере нашим программерам -
точно:)).
--- ifmail v.2.15dev5.3
* Origin: FidoNet Online - http://www.fido-online.com (2:5020/400)
Вернуться к списку тем, сортированных по: возрастание даты уменьшение даты тема автор
Архивное /ru.perl/166791e41e09c.html, оценка из 5, голосов 10
|