AliraSirin Опубликовано: 15 июня 2012 Поделиться Опубликовано: 15 июня 2012 Ну можно попробовать OCR, картинка простая (http://www.phpclasses.org/package/2874-PHP-Recognize-text-objects-in-graphical-images.html например в случае php) Ссылка на комментарий Поделиться на других сайтах More sharing options...
ASVShade Опубликовано: 15 июня 2012 Автор Поделиться Опубликовано: 15 июня 2012 Можно и видимо это единственный выход. Ссылка на комментарий Поделиться на других сайтах More sharing options...
Tinefol Опубликовано: 15 июня 2012 Поделиться Опубликовано: 15 июня 2012 ASVShade да. Кстати говоря, вытягивать цены покарточно - крайне неэффективно в плане трафика и времени. Гораздо удобнее выгружать список всех карт, а оттуда выбирать нужные. Ваш КО. Выход далеко не единственный, помимо этого есть еще 3 способа. AliraSirin картинка с визуальным шумом, если ее под лупой посмотреть. Не капча конечно, но не всё так просто. Ссылка на комментарий Поделиться на других сайтах More sharing options...
ASVShade Опубликовано: 15 июня 2012 Автор Поделиться Опубликовано: 15 июня 2012 ASVShade да. Кстати говоря, вытягивать цены покарточно - крайне неэффективно в плане трафика и времени. Гораздо удобнее выгружать список всех карт, а оттуда выбирать нужные. Ваш КО. Спасибо Кеп! AliraSirin картинка с визуальным мусором, если ее под лупой посмотреть. Не капча конечно, но не всё так просто. Все очень просто, почти любой OCR берет эту картинку, например: http://www.onlineocr.net/default.aspx mod: удолил из поста оффенс, еще раз увижу, приму глобальные меры Ссылка на комментарий Поделиться на других сайтах More sharing options...
chuk Опубликовано: 15 июня 2012 Поделиться Опубликовано: 15 июня 2012 Вы будете смеяться, но можно и без OCR: Request URL:http://sales.starcitygames.com/cart_product_ajax.php Request Method:POST Form Data: product:392729 qty:1 Response: {"success":true,"fatal_error":false,"feedback":"Abundant Growth was added to your cart at $0.25.","productid":"392729" ...} Ссылка на комментарий Поделиться на других сайтах More sharing options...
Tinefol Опубликовано: 15 июня 2012 Поделиться Опубликовано: 15 июня 2012 Да чему тут смеяться. Один из возможных способов. Они, кстати, не только корзину не прикрыли еще. Другое дело, что они рано или поздно сообразят эту лавочку прикрыть как минимум тем же способом, что и всё остальное. Да и покарточно вытягивать всю базу - скорость страдает слегка. Ссылка на комментарий Поделиться на других сайтах More sharing options...
amarto Опубликовано: 15 июня 2012 Поделиться Опубликовано: 15 июня 2012 Интересно, что будет, если предложить старситям самим выкладывать всю эту статистику в премиуме? ) Ссылка на комментарий Поделиться на других сайтах More sharing options...
chuk Опубликовано: 15 июня 2012 Поделиться Опубликовано: 15 июня 2012 Да чему тут смеяться. Один из возможных способов. Они, кстати, не только корзину не прикрыли еще. Другое дело, что они рано или поздно сообразят эту лавочку прикрыть как минимум тем же способом, что и всё остальное. Да и покарточно вытягивать всю базу - скорость страдает слегка. Аякс ок так форкается, для этого не надо выкачивать страницу целиком, респонзтайм мелкий, курл_мульти_экзек, нутыпонел; в рамках базы в 30к полчаса-час разницы в парсинге погоды не сделают. Ну и, пока не прикрыли, этот способ - решение проблемы малой кровью, по сравнению с OCR-то. CuneiForm, кстати, крутой OCR. Ссылка на комментарий Поделиться на других сайтах More sharing options...
Tinefol Опубликовано: 15 июня 2012 Поделиться Опубликовано: 15 июня 2012 Ну подключить OCR не слишком сложно, накладных расходов особо нет, плюс к тому мне не пришлось менять всю логику. Как раньше грузилось списком по много позиций, так и сейчас. Так что можно сказать это и есть малая кровь. А не через дырки тянуть каждый раз по-новому Ссылка на комментарий Поделиться на других сайтах More sharing options...
chuk Опубликовано: 15 июня 2012 Поделиться Опубликовано: 15 июня 2012 Ну подключить OCR не слишком сложно, накладных расходов особо нет, плюс к тому мне не пришлось менять всю логику. Как раньше грузилось списком по много позиций, так и сейчас. Так что можно сказать это и есть малая кровь. А не через дырки тянуть каждый раз по-новому Так надёжней, согласен Ждём цен каптча-стайл, вот тогда попляшем Ссылка на комментарий Поделиться на других сайтах More sharing options...
basilis Опубликовано: 15 июня 2012 Поделиться Опубликовано: 15 июня 2012 Так надёжней, согласен Ждём цен каптча-стайл, вот тогда попляшем конкуренты старситей тоже ждут)) бтв, мне это напомнило как один "программер" (опыт работы, все дела) жаловался, что калькулятор под мобилку написать не может. то ли там только целочисленные типы готовые, то ли маленькие по размеру. и что же делать? - вопрошал он. Сочувствия почему-то не встретил. Ссылка на комментарий Поделиться на других сайтах More sharing options...
AliraSirin Опубликовано: 15 июня 2012 Поделиться Опубликовано: 15 июня 2012 Так надёжней, согласен Ждём цен каптча-стайл, вот тогда попляшем Капча стайл вряд ли, эти картинки же используются как есть для отображения цен. Глупостями они занимаются, все равно всегда можно будет найти метод расковырять. Флешом разве что заморочатся. Проще запретить серии запросов с коротким промежутком времени с одного и того же айпишника (грубо говоря банить айпи после 100 запросов в течение N времени). Заморачиваться на смены проксей динамические никто не будет. Хотя в таком случае сделают слоу-слоу парсеры с задержками между запросами. Короче пусть сдаются Ссылка на комментарий Поделиться на других сайтах More sharing options...
Tinefol Опубликовано: 15 июня 2012 Поделиться Опубликовано: 15 июня 2012 basilis оо, конкуренты ситей тоже вовсю уже стараются. Например, небезысвестный channelfireball навесил на свой сайт столько всяких фишечек, примочек, свистелок и перделок, что им уже и пользоваться почти невозможно ввиду аццких тормозов и постоянных подвисаний. AliraSirin вот-вот, им бы сделать нормальное api с обязательством какой-нибудь рекламы пользующимся, а они занимаются бессмысленным огораживанием. Ссылка на комментарий Поделиться на других сайтах More sharing options...
basilis Опубликовано: 15 июня 2012 Поделиться Опубликовано: 15 июня 2012 basilis оо, конкуренты ситей тоже вовсю уже стараются. Например, небезысвестный channelfireball навесил на свой сайт столько всяких фишечек, примочек, свистелок и перделок, что им уже и пользоваться почти невозможно ввиду аццких тормозов и постоянных подвисаний. AliraSirin вот-вот, им бы сделать нормальное api с обязательством какой-нибудь рекламой, а они занимаются бессмысленным огораживанием. вот дебилы. как Зоя заметила - щелочка найдется (тут еще важный момент, что на торговом сайте свистелочки довольно лишние, будут посетители теряться), можно конечно все довести до ситуации, когда разве что из спортивного интереса осмысленно ломать. Но вообще неясно, какие такие дикие убытки старсити на этом несут, вот у них точно усилия не окупаются. ну и в общем в других областях инет-торговли это же проходили неоднократно, вроде эмпирически установили, что проще расслабиться. А еще проще вообще динамику самому выдавать, да. А байку про ботов на амазоне все знают? Ссылка на комментарий Поделиться на других сайтах More sharing options...
Tinefol Опубликовано: 15 июня 2012 Поделиться Опубликовано: 15 июня 2012 basilis не знаю байку. Ссылка на комментарий Поделиться на других сайтах More sharing options...
amarto Опубликовано: 15 июня 2012 Поделиться Опубликовано: 15 июня 2012 AliraSirin вот-вот, им бы сделать нормальное api с обязательством какой-нибудь рекламы пользующимся, а они занимаются бессмысленным огораживанием. Ну сейчас инвитейшнл пройдет, и я напишу, кому надо. Ссылка на комментарий Поделиться на других сайтах More sharing options...
AliraSirin Опубликовано: 15 июня 2012 Поделиться Опубликовано: 15 июня 2012 Ну им это может быть неприятно с точки зрения нагрузки на сервер. Я вот тут недавно испытала атаку бота парсера, цифры мне не понравились... Ссылка на комментарий Поделиться на других сайтах More sharing options...
Bigboss Опубликовано: 15 июня 2012 Поделиться Опубликовано: 15 июня 2012 Ну сейчас инвитейшнл пройдет, и я напишу, кому надо. И зачем? Ссылка на комментарий Поделиться на других сайтах More sharing options...
basilis Опубликовано: 15 июня 2012 Поделиться Опубликовано: 15 июня 2012 Ну им это может быть неприятно с точки зрения нагрузки на сервер. Я вот тут недавно испытала атаку бота парсера, цифры мне не понравились... хммм. Чисто абстрактно для них в относительных числах рост нагрузки не должен быть большим. про ботов - два амазоновских бота разных контор вошли в резонанс - у них была привязка в покупных списках (и, соответственно - продажных) к ценам конкурентов. До человеческого вмешательства в лямы баксов ушли за какую-то базовую книжку (желающие могут погуглить, я на память излагаю) Ссылка на комментарий Поделиться на других сайтах More sharing options...
Арготианская Выхухоль Опубликовано: 15 июня 2012 Поделиться Опубликовано: 15 июня 2012 Тролле-латынь кстати очень в тему =)) (гугл транслейт ок) А в прошлой версии (с картинкой 0123456789) была другая /* Mene, Mene, Tekel, Upharsin */ Ссылка на комментарий Поделиться на других сайтах More sharing options...
kremen Опубликовано: 15 июня 2012 Поделиться Опубликовано: 15 июня 2012 Всем ИХОРМА и РИВЕРБОА. Вы такие классные все. Ссылка на комментарий Поделиться на других сайтах More sharing options...
amarto Опубликовано: 15 июня 2012 Поделиться Опубликовано: 15 июня 2012 И зачем? затем что собственное приложение ситей, будя они решат этим заняться, явно будет удобнее всем самодельных парсеров. Или ты как трейдер, имеешь что-то против? про ботов - два амазоновских бота разных контор вошли в резонанс - у них была привязка в покупных списках (и, соответственно - продажных) к ценам конкурентов. До человеческого вмешательства в лямы баксов ушли за какую-то базовую книжку (желающие могут погуглить, я на память излагаю) Вот оно Ссылка на комментарий Поделиться на других сайтах More sharing options...
Bigboss Опубликовано: 15 июня 2012 Поделиться Опубликовано: 15 июня 2012 Всем ИХОРМА и РИВЕРБОА. Вы такие классные все. У кого чего болит ... Ссылка на комментарий Поделиться на других сайтах More sharing options...
AliraSirin Опубликовано: 15 июня 2012 Поделиться Опубликовано: 15 июня 2012 А в прошлой версии (с картинкой 0123456789) была другая /* Mene, Mene, Tekel, Upharsin */ ха, так они же сами себя обрекают на провал! Ссылка на комментарий Поделиться на других сайтах More sharing options...
Bigboss Опубликовано: 15 июня 2012 Поделиться Опубликовано: 15 июня 2012 затем что собственное приложение ситей, будя они решат этим заняться, явно будет удобнее всем самодельных парсеров. Или ты как трейдер, имеешь что-то против? Я как трейдер ничего против не имею, мне просто было интересно. Ссылка на комментарий Поделиться на других сайтах More sharing options...
Рекомендованные сообщения