Реклама на сайте Advertise with us

Парсинг Гугла

Расширенный поиск по форуму
 
Новая тема Новая тема   
Автор
Поиск в теме:



С нами с 20.04.06
Сообщения: 296
Рейтинг: 71

Ссылка на сообщениеДобавлено: 19/10/09 в 14:12       Ответить с цитатойцитата 

Вопрос прежде всего писателям парсинг скриптов ...
Никто не сталкивается несколько заключительных дней с тем, что Г. стал иногда игнорировать кавычки ?
Т.е. например запрашиваем у него скриптом (именно скриптом) search "слово1 слово2 слово3 слово4", а он выдаёт результат как будто search сделан без кавычек.
Причём если мы тутже, ручками скопируем URL этого неправильного скрипт-search в браузер, то search будет сделан уже правильно, учитывая кавычки.
Происходит это примерно с каждым вторым запросом.
Что это ? Глюк или Г. ввёл какие-то новые параметры ?

0
 



С нами с 24.10.04
Сообщения: 18881
Рейтинг: 9010


Передовик Master-X (16.03.2006) Передовик Master-X (01.04.2006) Передовик Master-X (16.04.2006) Передовик Master-X (01.05.2006) Передовик Master-X (01.11.2006) Ветеран трепа Master-X ()
Ссылка на сообщениеДобавлено: 19/10/09 в 14:15       Ответить с цитатойцитата 

это неправильный скрипт

0
 



С нами с 20.04.06
Сообщения: 296
Рейтинг: 71

Ссылка на сообщениеДобавлено: 19/10/09 в 14:25       Ответить с цитатойцитата 

Скрипт идеально работает 3 года.

P.S. Прошу отписывать только тех, кому есть что сказать по делу.
Те, кто считают что, только они достаточно умны, чтобы отличить правильный скрипт от неправильного, накручивайте себе кол-во постов в другом месте.

0
 



С нами с 09.03.09
Сообщения: 6053
Рейтинг: 3538


Передовик Master-X (01.11.2009) Передовик Master-X (16.11.2009) Передовик Master-X (01.02.2011) Передовик Master-X (01.12.2011) Передовик Master-X (16.12.2011) Ветеран трепа Master-X (01.01.2014)
Ссылка на сообщениеДобавлено: 19/10/09 в 16:08       Ответить с цитатойцитата 

Не всё так как ты описал, но похоже на то. Кавычки он, конечно, не игнорирует.

А "слово1 слово2 слово3 слово4" представляет собой устойчивое словосочетание?
Или у тебя по любым запросам беда?

0
 



С нами с 24.10.04
Сообщения: 18881
Рейтинг: 9010


Передовик Master-X (16.03.2006) Передовик Master-X (01.04.2006) Передовик Master-X (16.04.2006) Передовик Master-X (01.05.2006) Передовик Master-X (01.11.2006) Ветеран трепа Master-X ()
Ссылка на сообщениеДобавлено: 19/10/09 в 16:18       Ответить с цитатойцитата 

WebOldie писал:
Скрипт идеально работает 3 года.
P.S. Прошу отписывать только тех, кому есть что сказать по делу.
Те, кто считают что, только они достаточно умны, чтобы отличить правильный скрипт от неправильного, накручивайте себе кол-во постов в другом месте.


значит у гугла появился javascript при поиске...
или у тебя скрипт который делает запросы браузерным движком (под win32 например)?

0
 



С нами с 20.04.06
Сообщения: 296
Рейтинг: 71

Ссылка на сообщениеДобавлено: 19/10/09 в 17:35       Ответить с цитатойцитата 

Yacc писал:
Не всё так как ты описал, но похоже на то. Кавычки он, конечно, не игнорирует.
А "слово1 слово2 слово3 слово4" представляет собой устойчивое словосочетание?
Или у тебя по любым запросам беда?


Любая фраза. Причём один раз он может выдать как-бы без кавычек, а сразу повторишь и выдаёт уже с учётом кавычек.
От ДЦ не зависит. От языка не зависит. Параметры разные попробовал добавить/убрать - ничего не помогает.

Полазил, почитал чего народ говорит ... Восновном ничего )
Единственное, что возможно Г. стал учитывать историю запросов каждого отдельного пользователя и стал выдавать результаты в зависимости от истории тоже. Типа, если два пользователя залогинены в gmail (например), то по одинаковому запросу у них выдача может быть разная.
Но я попробовал с разных компов (залогиненых и нет) - тоже ничего не помогает.
Да и наврядли история может влиять на учитывание кавычек. Какая бы ни была история, а если пользователь хочет точное соответствие (в кавычках), то уж подай ему именно точное соответствие.

Помнится пару лет назад был у Г. какой-то похожий глюк ... именно с кавычками. Непонятно вообщем.

А у тебя какие симптомы ?

Последний раз редактировалось: WebOldie (19/10/09 в 17:39), всего редактировалось 1 раз

0
 



С нами с 20.04.06
Сообщения: 296
Рейтинг: 71

Ссылка на сообщениеДобавлено: 19/10/09 в 17:37       Ответить с цитатойцитата 

ibiz писал:
значит у гугла появился javascript при поиске...
или у тебя скрипт который делает запросы браузерным движком (под win32 например)?


Имитируется браузерный запрос (если я правильно понял твой вопрос).

0
 



С нами с 24.10.04
Сообщения: 18881
Рейтинг: 9010


Передовик Master-X (16.03.2006) Передовик Master-X (01.04.2006) Передовик Master-X (16.04.2006) Передовик Master-X (01.05.2006) Передовик Master-X (01.11.2006) Ветеран трепа Master-X ()
Ссылка на сообщениеДобавлено: 19/10/09 в 18:01       Ответить с цитатойцитата 

WebOldie писал:
Имитируется браузерный запрос (если я правильно понял твой вопрос).


ну тоесть твой скрипт исполняет javascript с сервера при запросах?
если не исполняет, то проблема в скрипте, отличий от браузерного запроса кроме javascript и прочих апплетов быть неможет, тогда скрипт неправильный, если такие-же ошибки возникают и в браузере, то проблема у гугла
за годы работы в онлайне напарсил гигабайты гугла, и не только, при помощи рнр и курла, и представляю о чем говорю

0
 



С нами с 09.03.09
Сообщения: 6053
Рейтинг: 3538


Передовик Master-X (01.11.2009) Передовик Master-X (16.11.2009) Передовик Master-X (01.02.2011) Передовик Master-X (01.12.2011) Передовик Master-X (16.12.2011) Ветеран трепа Master-X (01.01.2014)
Ссылка на сообщениеДобавлено: 19/10/09 в 18:03       Ответить с цитатойцитата 

Я наблюдаю такую картину: если запрос (без кавычек) представляет собой устойчивое словосочетание, то результаты (с кавычками и без) почти одинаковые. По крайней мере топ10 отличается только структурой, сниппетами и заголовками - сайты одни и те же.

Мысль такая: г. делает предположение об устойчивости словосочетания, сравнивая результаты для обычного запроса и точного.

Т.е., например, результаты для "anal sex toys" и anal sex toys - будут похожи, а для "anal sex toys porn" и anal sex toys porn - нет.

зы: всё имхо и для google.com/webhp

0
 



С нами с 24.10.04
Сообщения: 18881
Рейтинг: 9010


Передовик Master-X (16.03.2006) Передовик Master-X (01.04.2006) Передовик Master-X (16.04.2006) Передовик Master-X (01.05.2006) Передовик Master-X (01.11.2006) Ветеран трепа Master-X ()
Ссылка на сообщениеДобавлено: 19/10/09 в 18:13       Ответить с цитатойцитата 

Yacc писал:
Т.е., например, результаты для "anal sex toys" и anal sex toys - будут похожи, а для "anal sex toys porn" и anal sex toys porn - нет.
зы: всё имхо и для google.com/webhp


из первого поста ТС следует, что у него проблема в том, что два одинаковых запроса первый через скрипт, второй через браузер выдают различные результаты...

0
 



С нами с 20.04.06
Сообщения: 296
Рейтинг: 71

Ссылка на сообщениеДобавлено: 19/10/09 в 18:26       Ответить с цитатойцитата 

ibiz писал:
из первого поста ТС следует, что у него проблема в том, что два одинаковых запроса первый через скрипт, второй через браузер выдают различные результаты...


именно ...
Но через скрипт невсегда кавычки игнорируются, а через раз.

Скрипт не может быть неправильный. 3 года как часы работает.
Или глюк у Г., или введён какой-то новый параметр, который позволяет ему отличить ручной запрос от скриптового.

имхо конечно

0
 



С нами с 20.04.06
Сообщения: 296
Рейтинг: 71

Ссылка на сообщениеДобавлено: 19/10/09 в 18:27       Ответить с цитатойцитата 

Yacc писал:
Я наблюдаю такую картину ...


Нее, это другая проблема.

0
 



С нами с 09.03.09
Сообщения: 6053
Рейтинг: 3538


Передовик Master-X (01.11.2009) Передовик Master-X (16.11.2009) Передовик Master-X (01.02.2011) Передовик Master-X (01.12.2011) Передовик Master-X (16.12.2011) Ветеран трепа Master-X (01.01.2014)
Ссылка на сообщениеДобавлено: 19/10/09 в 19:14       Ответить с цитатойцитата 

Не знаю, что у тебя там за скрипт.
Проверил с десяток запросов скриптом (на основе activex из mshtml.dll) и руками. Результаты одинаковые.

Однако тема с кавычками имеет место быть. И началось всё аккурат на прошлой неделе.

0
 



С нами с 20.04.06
Сообщения: 296
Рейтинг: 71

Ссылка на сообщениеДобавлено: 19/10/09 в 19:39       Ответить с цитатойцитата 

Yacc писал:
Не знаю, что у тебя там за скрипт.
Проверил с десяток запросов скриптом (на основе activex из mshtml.dll) и руками. Результаты одинаковые.
Однако тема с кавычками имеет место быть. И началось всё аккурат на прошлой неделе.


Дык я речь именно про кавычки и веду ... И началось всё аккурат на прошлой неделе )

0
 



С нами с 09.03.09
Сообщения: 6053
Рейтинг: 3538


Передовик Master-X (01.11.2009) Передовик Master-X (16.11.2009) Передовик Master-X (01.02.2011) Передовик Master-X (01.12.2011) Передовик Master-X (16.12.2011) Ветеран трепа Master-X (01.01.2014)
Ссылка на сообщениеДобавлено: 19/10/09 в 19:46       Ответить с цитатойцитата 

Так это не проблема скрипта - руками то же самое получается. icon_smile.gif

0
 



С нами с 09.03.09
Сообщения: 6053
Рейтинг: 3538


Передовик Master-X (01.11.2009) Передовик Master-X (16.11.2009) Передовик Master-X (01.02.2011) Передовик Master-X (01.12.2011) Передовик Master-X (16.12.2011) Ветеран трепа Master-X (01.01.2014)
Ссылка на сообщениеДобавлено: 19/10/09 в 19:52       Ответить с цитатойцитата 

ibiz писал:
из первого поста ТС следует, что у него проблема в том, что два одинаковых запроса первый через скрипт, второй через браузер выдают различные результаты...


WebOldie писал:
именно ...


Запрос в студию. icon_smile.gif

0
 



С нами с 20.04.06
Сообщения: 296
Рейтинг: 71

Ссылка на сообщениеДобавлено: 19/10/09 в 21:31       Ответить с цитатойцитата 

Yacc писал:
Запрос в студию. icon_smile.gif


Ну например взял первый попавшийся текст, скрипт оттуда дернул фразу ... результат :
http://img.villagephotos.com/p/2006-6/1191386/temp1.jpg
Г. обработал фразу как будто кавычек нет.


А если ты эту же фразу в тех же кавычках загонишь в Г. ручками, то результат будет как всегда :
http://img.villagephotos.com/p/2006-6/1191386/temp2.jpg

Хм ... только сеичас обратил внимание, что результаты то одинаковые. Просто в первом случае отсутствует строка, предлагаюшая сделать search без кавычек.
Вообще ничего не понимаю ... icon_confused.gif

P.S. Сразу оговорюсь, что от смены языка суть не меняется.

0
 



С нами с 09.03.09
Сообщения: 6053
Рейтинг: 3538


Передовик Master-X (01.11.2009) Передовик Master-X (16.11.2009) Передовик Master-X (01.02.2011) Передовик Master-X (01.12.2011) Передовик Master-X (16.12.2011) Ветеран трепа Master-X (01.01.2014)
Ссылка на сообщениеДобавлено: 20/10/09 в 00:31       Ответить с цитатойцитата 

WebOldie писал:
...в первом случае отсутствует строка, предлагаюшая сделать search без кавычек.

Прверил по твоему запросу - результаты одинаковые. И как я ни крутил, но такого результата как на первой картинке скриптом не получается - фраза

Цитата:
No se ha encontrado ningún resultado para "Mane and Tail Shampoo if the eyes are the doorway to a person's soul,".

есть всегда.

Ещё интерфейс на первой картинке странный. У меня всегда такой же как в браузере.

А как ты браузер имитируешь? Скрипт кнопку нажимает?

0
 



С нами с 20.04.06
Сообщения: 296
Рейтинг: 71

Ссылка на сообщениеДобавлено: 20/10/09 в 01:07       Ответить с цитатойцитата 

Yacc писал:
Прверил по твоему запросу - результаты одинаковые. И как я ни крутил, но такого результата как на первой картинке скриптом не получается - фраза

есть всегда.


Уверяю тебя, что эту картинку я не рисовал ручками ))

0
 



С нами с 20.04.06
Сообщения: 296
Рейтинг: 71

Ссылка на сообщениеДобавлено: 20/10/09 в 01:09       Ответить с цитатойцитата 

И самое интересное, что этот сбой происходит только в 30-40%
Т.е. в большинстве случаев всё работает по-прежнему без проблем.

0
 



С нами с 09.03.09
Сообщения: 6053
Рейтинг: 3538


Передовик Master-X (01.11.2009) Передовик Master-X (16.11.2009) Передовик Master-X (01.02.2011) Передовик Master-X (01.12.2011) Передовик Master-X (16.12.2011) Ветеран трепа Master-X (01.01.2014)
Ссылка на сообщениеДобавлено: 20/10/09 в 01:20       Ответить с цитатойцитата 

WebOldie писал:
Уверяю тебя, что эту картинку я не рисовал ручками ))

Охотно верю. smail101.gif

Сравним запросы:

Цитата:
http://www.google.com/search?
hl=es&
source=hp&
q="Mane+and+Tail+Shampoo+if+the+eyes+are+the+doorway+to+a+person's+soul,"&
btnG=Buscar+con+Google&
lr=&
aq=f&
oq=


А интерфейс у тебя всегда такой как на первой картинке?

0
 



С нами с 20.04.06
Сообщения: 296
Рейтинг: 71

Ссылка на сообщениеДобавлено: 20/10/09 в 01:31       Ответить с цитатойцитата 

Запрос без некоторых параметров (&source=hp напр.), но я их все по отдельности и кучей и по разному менял, подставлял, переставлял ---> пофиг.

Интерфейс такой только когда "забывает" по кавычки.
Когда нормально срабатывет, тогда и интерфейс нормальный.
Просто даже не понимаю в какую сторону ещё думать.

0
 



С нами с 09.03.09
Сообщения: 6053
Рейтинг: 3538


Передовик Master-X (01.11.2009) Передовик Master-X (16.11.2009) Передовик Master-X (01.02.2011) Передовик Master-X (01.12.2011) Передовик Master-X (16.12.2011) Ветеран трепа Master-X (01.01.2014)
Ссылка на сообщениеДобавлено: 20/10/09 в 01:44       Ответить с цитатойцитата 

Проверь скриптом тот же запрос здесь
http://www2.sandbox.google.com/

Цитата:
Интерфейс такой только когда "забывает" по кавычки.
Когда нормально срабатывет, тогда и интерфейс нормальный.

Это вопрос вопросов.

Ты так и не сказал на чём построен твой чудо-скрипт. Хоть намекни - я пойму. icon_smile.gif

зы А если запрос по-проще взять. Типа тех, что я выше приводил.

0
 



С нами с 20.04.06
Сообщения: 296
Рейтинг: 71

Ссылка на сообщениеДобавлено: 20/10/09 в 02:02       Ответить с цитатойцитата 

В Caffeine тоже самое. Это было первое что проверил )
Количество слов тоже не влияет.

Чуда нет никакого. Точно также как и все - дергает фразу и search её.
Просто алгоритм построен умно. Поэтому и работает с уверенностью 97%.
Точнее работал.

0
 



С нами с 20.04.06
Сообщения: 296
Рейтинг: 71

Ссылка на сообщениеДобавлено: 20/10/09 в 02:09       Ответить с цитатойцитата 

Yacc, ты программер ?

0
 
Новая тема Новая тема   

Текстовая реклама в форме ответа
Заголовок и до четырех строчек текста
Длина текста до 350 символов
Купить рекламу в этом месте!


Перейти:  



Спонсор раздела Стань спонсором этого раздела!

Реклама на сайте Advertise with us

Опросы

Рецепт новогоднего блюда 2022



Обсудите на форуме обсудить (11)
все опросы »