18 декабря 2013

Что в словах ?

Дурость.. дурость..

пишу заголовки пачками и удивляюсь. в любом заголовке есть 1-2 ключевых слова, остальные выражают как бы действие или какие-то свойства, но по сути не рассказывают ничего больше.

Эти 2 слова из загловка являются ключевыми при подборе сопуствующих материалов, картинок, видео, анекдотов, карт, товаров и т.п.

Остальные слова не нужны.

Вот такая у меня мысль. жестокая.

Как вычленить из заголовка суть ?

Выбросить мусор или оставить сущность ?

Кажется оставить сущьность, однако выбрасывая мусор можно автоматизировать задачу хоть как-то. Можно поступить совершенным образом, провряя частотность слов через поиски.

Однако это лишние запросы и тормоза. Хорошо бы тут подключить самообучающийся алгоритм, который бы из всей истории выделял частые слова и редкие.

Хотя все это тоже говно и утопично, хотя я уверен Бобук не врет и мозг создать легко, тем более даже Ал еще в дестве это уже делал.

 

Нет нет. остановитесь щщенок !

первый вариант почти идеален:

Тыкаем на слова пустышки и они уходят в ТОПКУ и больше никогда не появятся в заголовках для поиска сопутствующих материалов.

А может быть все дело в сущетвительных ?

Еще одно, я бы хотел выбирать пустышки с учетом окончаний, а не тыкая в одно слово 10 раз в разных склонениях.

 

Тоже задачка да ?

Кажись на Хабре было что-то


Видеочат рулетка