Предлагам ви да използвате Библиотеката DOM на PHP . Той е много мощен и позволява анализиране на всяка DOM структура. Вижте някои от неговите примери и можете лесно да го приложите.
Идеята е да изучавате HTML структурата на страницата, върната от Google, и съответно да използвате DOM библиотеката за анализиране на конкретни тагове. От това, което виждам, изображенията са организирани като <ul>
и <li>
тагове, като:
<ul class="rg_ul" data-pg="1" data-cnt="6">
<li class="rg_li" data-row="1" style="width:216px;height:162px"></li>
<li class="rg_li" style="width:231px;height:162px"></li>
<li class="rg_li" style="width:218px;height:162px"></li>
<li class="rg_li" style="width:216px;height:162px"></li>
<li class="rg_li" style="width:216px;height:162px"></li>
<li class="rg_li" style="width:217px;height:162px"></li>
</ul>
Във всеки <li>
има допълнителни тагове, единият от които е <a>
. Изглежда, че този маркер има 2 атрибута - "imgrefurl" и "imgurl" - които може да ви дадат изображението, от което се нуждаете. Кой от тези 2 атрибута ви е необходим, вие трябва да проучите.
Като алтернатива има <img>
таг в <li>
който има атрибут "src", съдържащ действителното двоично изображение. Така че можете също да го анализирате. Моля, имайте предвид, че двоичният файл е за изображението, което виждате на страницата за търсене, а не за действителното изображение.
За някои указатели към DOM този метод може да е полезен - http://www .php.net/manual/en/domelement.getelementsbytagname.php
и http://www.php.net/manual/en/domelement. hasattribute.php
- да прочетете всички <li>
тагове и след това анализирайте за тези, използващи клас "rg_li".
Надявам се, че горното има смисъл