Дурость.. дурость..
пишу заголовки пачками и удивляюсь. в любом заголовке есть 1-2 ключевых слова, остальные выражают как бы действие или какие-то свойства, но по сути не рассказывают ничего больше.
Эти 2 слова из загловка являются ключевыми при подборе сопуствующих материалов, картинок, видео, анекдотов, карт, товаров и т.п.
Остальные слова не нужны.
Вот такая у меня мысль. жестокая.
Как вычленить из заголовка суть ?
Выбросить мусор или оставить сущность ?
Кажется оставить сущьность, однако выбрасывая мусор можно автоматизировать задачу хоть как-то. Можно поступить совершенным образом, провряя частотность слов через поиски.
Однако это лишние запросы и тормоза. Хорошо бы тут подключить самообучающийся алгоритм, который бы из всей истории выделял частые слова и редкие.
Хотя все это тоже говно и утопично, хотя я уверен Бобук не врет и мозг создать легко, тем более даже Ал еще в дестве это уже делал.
Нет нет. остановитесь щщенок !
первый вариант почти идеален:
Тыкаем на слова пустышки и они уходят в ТОПКУ и больше никогда не появятся в заголовках для поиска сопутствующих материалов.
А может быть все дело в сущетвительных ?
Еще одно, я бы хотел выбирать пустышки с учетом окончаний, а не тыкая в одно слово 10 раз в разных склонениях.
Тоже задачка да ?
Кажись на Хабре было что-то