Някой вече го е направил.
Магията, която търсите, е php функция, наречена str_word_count() .
В моя примерен код по-долу, ако получите много ненужни думи от това, ще трябва да напишете персонализирано премахване, за да ги премахнете. Освен това ще искате да премахнете всички html тагове от думите и други знаци.
Използвам нещо подобно на това за генериране на ключови думи (очевидно този код е собствен). Накратко, ние вземаме предоставения текст, проверяваме честотата на думите и ако думите се появяват по ред, ги сортираме в масив въз основа на приоритет. Така че най-честите думи ще бъдат първи в изхода. Не броим думи, които се срещат само веднъж.
<?php
$text = "your text.";
//Setup the array for storing word counts
$freqData = array();
foreach( str_word_count( $text, 1 ) as $words ){
// For each word found in the frequency table, increment its value by one
array_key_exists( $words, $freqData ) ? $freqData[ $words ]++ : $freqData[ $words ] = 1;
}
$list = '';
arsort($freqData);
foreach ($freqData as $word=>$count){
if ($count > 2){
$list .= "$word ";
}
}
if (empty($list)){
$list = "Not enough duplicate words for popularity contest.";
}
echo $list;
?>