Реклама на сайте Advertise with us

Как роботом отделить красивые тумбы от некрасивых?

Расширенный поиск по форуму
 
Новая тема Новая тема   
Автор
Поиск в теме:



С нами с 18.11.99
Сообщения: 14226

Ссылка на сообщениеДобавлено: 26/03/10 в 22:40       Ответить с цитатойцитата 

Есть много тумбнейлов различной красивости. Устроить ротацию и померять кликабельность возможности нет. Хотелось бы их грубо разделить на несколько фракций.

Как научить робота отличать яркие, контраcтные, сочные тумбы, от блеклых, смазанных, одноцветных?

Тумбы резались и кропились автоматом, гламурить возможности нет.

Пример более менее приличных тумбнейлов:


Пример плохих тумбнейлов:


Последний раз редактировалось: kit (01/04/10 в 23:37), всего редактировалось 1 раз

0
 

маниакально- депрессивный псих

С нами с 21.02.09
Сообщения: 1445
Рейтинг: 860

Ссылка на сообщениеДобавлено: 26/03/10 в 22:56       Ответить с цитатойцитата 

один из параметров - вес тумбы. Чем больше ярких цветов, тем тяжелее.

CDN from $0,8/Mbps - от адванседов

10
 

♣ MAFIA ♣

С нами с 03.07.07
Сообщения: 1657
Рейтинг: 2246


Передовик Master-X (16.12.2009) Передовик Master-X (01.01.2010)
Ссылка на сообщениеДобавлено: 27/03/10 в 01:08       Ответить с цитатойцитата 

kit писал:

Как научить робота отличать яркие, контраcтные, сочные тумбы, от блеклых, смазанных, одноцветных?


методом тестовых заданий, проб и ошибок icon_razz.gif

хорошо отличил - получи на нормальную еду, плохо отличил - получи на черный хлеб ... или голодай smail101.gif

Директор Порно Добывающего и Порно Перерабатывающего Комбината (ПДППК)
Я - люблю сиджепида!

-10
 

1К13!

С нами с 07.05.04
Сообщения: 7721
Рейтинг: 2428

Ссылка на сообщениеДобавлено: 27/03/10 в 01:30       Ответить с цитатойцитата 

в плохих тумбах как правило левелс криворукие, соответственно имхо надо имаджмэджиком чекать левелс у тумбы ( менять-то уровни имэджмэджик умеет - http://www.imagemagick.org/script/command-line-options.php#level - видимо должен уметь и просто чекать распределение уровней на картинке)

Talitha kumi!

10
 

♥♥♥

С нами с 28.08.04
Сообщения: 7098
Рейтинг: 5671


Передовик Master-X (01.08.2007) Передовик Master-X (16.08.2007)
Ссылка на сообщениеДобавлено: 27/03/10 в 01:49       Ответить с цитатойцитата 

имхо как раз по методу Foxy Babe:

0
 

programmer

С нами с 08.12.02
Сообщения: 7607
Рейтинг: 5752

Ссылка на сообщениеДобавлено: 27/03/10 в 02:32       Ответить с цитатойцитата 

benzole:
интересно было бы узнать про авточек уровня.
в свое время экспериментировал с яркостью-контрастностью, все оказалось жутко нелинейно

крипта на ByBit

0
 

Soul's Buyer

С нами с 16.11.05
Сообщения: 12702
Рейтинг: 10740


Передовик Master-X (16.10.2008) Передовик Master-X (01.11.2008) Передовик Master-X (16.11.2008) Передовик Master-X (01.12.2008) Передовик Master-X (16.12.2008) Ветеран трепа Master-X (01.01.2009)
Ссылка на сообщениеДобавлено: 27/03/10 в 02:34       Ответить с цитатойцитата 

+1 Foxy Babe, главное не закармливать робота

Cdn быстро, надёжно и недорого!

0
 



С нами с 30.08.07
Сообщения: 470
Рейтинг: 272

Ссылка на сообщениеДобавлено: 27/03/10 в 03:28       Ответить с цитатойцитата 

И какое нынче в среднем энергопотребление у хороших роботов на каждую тысячу тумб?

0
 

1К13!

С нами с 07.05.04
Сообщения: 7721
Рейтинг: 2428

Ссылка на сообщениеДобавлено: 27/03/10 в 03:37       Ответить с цитатойцитата 

Sterx писал:
benzole:
интересно было бы узнать про авточек уровня.


чессговоря это я просто гипотезу выдвинул. ничего конкретного сказать не могу . смысл в том, что когда хочешь сделать из приведённой в примере "плохой" картинки "хорошую" - одним из распространённых вариантов в фотошопе является просто растянуть диапазон яркостей между блэк пойнтом и вайт пойнтом.

вот пример гистограммы "плохой картинки" -



характерной особенностью является наличие "провалов" справа и слева между основными границами гистограммы и черной и белой точками.

чтобы эту картинку сделать более смотрибельной, надо слайдеры белой и черной точек передвинуть на основные границы гистограммы.

т.е у картинки с плохими уровнями есть провалы в экстремумах яркостей (там где "черная" и "белая" точки):

.........||||||||||||||||......
0------------------------------255


а у картинки с хорошими уровнями - присутствует весь диапазон отсчётов яркостей, притом он имеет более-менее однородную структуру, как правило без резких пиков и провалов:

...||||||||||||||||||||||||||..
0------------------------------255


а как программно определить картинки с такой гистограммой - я хз.

Talitha kumi!

10
 

♥♥♥

С нами с 28.08.04
Сообщения: 7098
Рейтинг: 5671


Передовик Master-X (01.08.2007) Передовик Master-X (16.08.2007)
Ссылка на сообщениеДобавлено: 27/03/10 в 12:22       Ответить с цитатойцитата 

автоуровни есть в имейджмеджике и он исправляет эту неровность - только вот тока проблема, не значит это что получится нормальная тумбаicon_smile.gif

0
 

SEOшник

С нами с 20.10.02
Сообщения: 5375
Рейтинг: 1798

Ссылка на сообщениеДобавлено: 27/03/10 в 12:47       Ответить с цитатойцитата 

нейросети, пусть сам робот учится icon_rolleyes.gif
только сказать труднее чем сделать icon_neutral.gif

Заказывай грамотное продвижение сайтов у специалиста.

0
 

1К13!

С нами с 07.05.04
Сообщения: 7721
Рейтинг: 2428

Ссылка на сообщениеДобавлено: 27/03/10 в 13:03       Ответить с цитатойцитата 

Kn писал:
автоуровни есть в имейджмеджике и он исправляет эту неровность - только вот тока проблема, не значит это что получится нормальная тумбаicon_smile.gif


не, вопрос ведь стоИт не в улучшении, а в обнаружении.

Talitha kumi!

0
 



С нами с 08.02.03
Сообщения: 10558
Рейтинг: 5961


Передовик Master-X (01.06.2018) Передовик Master-X (16.06.2019) Передовик Master-X (01.04.2020) Передовик Master-X (16.04.2020) Передовик Master-X (16.10.2021) Ветеран трепа Master-X (01.11.2021)
Ссылка на сообщениеДобавлено: 27/03/10 в 14:30       Ответить с цитатойцитата 

Ну как вариант берем 100 точек с тумбы делаем автокорекцию тем же IM по тем же точкам проверяем сильно ли ушел цвет
1.если ваще сильно и везде значит - тумба гавно....
2.если сильно но не везде - тумба гавно?
3.не ушел/не сильно везде/не везде - тумба хорошего качества....

Вощем над попробовать и подбирать...

0
 



С нами с 06.05.03
Сообщения: 582
Рейтинг: 301

Ссылка на сообщениеДобавлено: 27/03/10 в 14:39       Ответить с цитатойцитата 

Для вышепоставленной задачи достаточно IM.
Копать надо в сторону утилиты identify (с параметром -verbose), а среди выводимых ей результатов смотрим Channel statistics.

Понятно, что тумбы тумбам рознь, но примеры из первого поста определяются данным способом со 100% точностью.


Для более сложных случаев, этого будет не достаточно... У меня сокурсники писали дипломы по теме вроде "пиксельный анализ изображения" - это дело было на Си++, давно и не правда ;)

0
 

пират

С нами с 25.10.02
Сообщения: 3071
Рейтинг: 776

Ссылка на сообщениеДобавлено: 27/03/10 в 15:10       Ответить с цитатойцитата 

в сервис для распознавания капч зарядить. выдавать две пиксы на выбор - быстро отсеят имхо =)

скупаю tumblr блоги. дорого.

0
 

Мотиватор :)

С нами с 06.05.09
Сообщения: 3028
Рейтинг: 607

Ссылка на сообщениеДобавлено: 27/03/10 в 23:11       Ответить с цитатойцитата 

Вот результат небольшого эксперимента

Код:
<?
$images = array("3583086.jpg", "5129499.jpg", "5233995.jpg", "5276998.jpg", "5635460.jpg", "5650199.jpg", "5846497.jpg", "5968560.jpg");

foreach ($images as $image)
{
    $im = new Imagick($image);
    $im->edgeImage(1.0);
    $im->posterizeImage(2, false);
    $im->writeImage("thumbs/{$image}");
    unset($im);
}
?>


Результат работы скрипта:



Суть заключается в том, что у "сочных" тумб с большим количеством цветов и не смазанных будут более чёткие края. У смазанных и неконтрастных наоборот - они в результате обработки стали почти чёрными. Далее подсчитываем отношение количества чёрных\не чёрных пикселей, и чем больше не чёрных, тем субъективно более качественная тумба. Не было возможности проверить на большой выборке.

Метод конечно же, не претендует на ноу-хау, и не со всеми тумбами будет давать правильный результат. Но это эксперимент :-)

Just a signature.

0
 



С нами с 18.11.99
Сообщения: 14226

Ссылка на сообщениеДобавлено: 28/03/10 в 03:06       Ответить с цитатойцитата 

Pikuper, alex.raven
спасибо за интересные варианты. Но есть вопросы:
1) Как быстро посчитать черноту картинки?
2) Identify->Channel statistic: что именно там смотреть?

0
 

Мотиватор :)

С нами с 06.05.09
Сообщения: 3028
Рейтинг: 607

Ссылка на сообщениеДобавлено: 28/03/10 в 03:55       Ответить с цитатойцитата 

kit писал:
Pikuper, alex.raven
спасибо за интересные варианты. Но есть вопросы:
1) Как быстро посчитать черноту картинки?
2) Identify->Channel statistic: что именно там смотреть?


вот так:

Код:
<?
$images = array(
"3583086.jpg",
"5129499.jpg",
"5233995.jpg",
"5276998.jpg",
"5635460.jpg",
"5650199.jpg",
"5846497.jpg",
"5968560.jpg",
);
$i=0;
foreach ($images as $image)
{
    $im = new Imagick($image);
    $im->edgeImage(1.0);
    $im->posterizeImage(2, false);
    $im->writeImage("thumbs/{$image}");
    $width = $im->getImageWidth();
    $height = $im->getImageHeight();
    $black = 0; $nonblack = 0;
    for ($y=0; $y<$height; $y++)
    {
        for ($x = 0; $x<$width; $x++)
        {
            $pixel = $im->getImagePixelColor($x, $y);
            $color = $pixel->getColor();
            $value = $color['r'] + $color['g'] + $color['b'];
            if ($value>0)
            {
                $nonblack++;
            }
            else
            {
                $black++;
            }
        }
    }
    echo "{$image}, black: {$black}, non-black: {$nonblack}<br />";
    $i++;
    unset($im);
}
?>


результат работы:

3583086.jpg, black: 18970, non-black: 230
5129499.jpg, black: 17649, non-black: 1551
5233995.jpg, black: 18930, non-black: 270
5276998.jpg, black: 17328, non-black: 1872
5635460.jpg, black: 17461, non-black: 1739
5650199.jpg, black: 18781, non-black: 419
5846497.jpg, black: 16873, non-black: 2327
5968560.jpg, black: 17018, non-black: 2182

пихаем значения в базу данных, и затем делаем

Код:
SELECT * FROM thumbs ORDER BY nonblack DESC;


скрипт довольно медленный из-за большого числа итераций, так что лучше сначала проапдейтить базу, а не вызывать его в реалтайме для каждой тумбы.

Just a signature.

0
 



С нами с 08.02.03
Сообщения: 10558
Рейтинг: 5961


Передовик Master-X (01.06.2018) Передовик Master-X (16.06.2019) Передовик Master-X (01.04.2020) Передовик Master-X (16.04.2020) Передовик Master-X (16.10.2021) Ветеран трепа Master-X (01.11.2021)
Ссылка на сообщениеДобавлено: 28/03/10 в 09:27       Ответить с цитатойцитата 

alex.raven smail54.gif отличное решение помоему
Немного подгламурим
Цитата:

$value = $color['r'] + $color['g'] + $color['b'];

лишний кусок при всех нулях итак $color = $pixel->getColor(); будет нулем....
Код:

$color = $pixel->getColor();
#            $value = $color['r'] + $color['g'] + $color['b'];
            if ($color>0)
            {

0
 

Мотиватор :)

С нами с 06.05.09
Сообщения: 3028
Рейтинг: 607

Ссылка на сообщениеДобавлено: 28/03/10 в 10:04       Ответить с цитатойцитата 

JM писал:
alex.raven smail54.gif отличное решение помоему
Немного подгламурим
лишний кусок при всех нулях итак $color = $pixel->getColor(); будет нулем....
Код:

$color = $pixel->getColor();
#            $value = $color['r'] + $color['g'] + $color['b'];
            if ($color>0)
            {


не сработает, т.к getColor() возвращает не число, а ассоциативный массив c элементами r, g, b.

Just a signature.

0
 



С нами с 06.05.03
Сообщения: 582
Рейтинг: 301

Ссылка на сообщениеДобавлено: 28/03/10 в 11:16       Ответить с цитатойцитата 

kit писал:
Pikuper, alex.raven
спасибо за интересные варианты. Но есть вопросы:
1) Как быстро посчитать черноту картинки?
2) Identify->Channel statistic: что именно там смотреть?


Если мы говорим об уровнях, как о показателе сочности картинки, то смотрим на минимальные (0) и максимальные (255) значения для каждого цвета (red, green, blue).

Приведу пример значений для данных тумб:
    5635460.jpg red: 0 255; green: 0 255; blue: 0 255;
    5846497.jpg red: 0 255; green: 0 255; blue: 0 255;
    5968560.jpg red: 0 255; green: 0 255; blue: 0 255;
    5276998.jpg red: 26 255; green: 6 255; blue: 0 255;

    5129499.jpg red: 24 255; green: 21 255; blue: 9 255;
    5650199.jpg red: 3 209; green: 4 189; blue: 0 160;
    5233995.jpg red: 16 255; green: 21 255; blue: 15 255;
    3583086.jpg red: 1 202; green: 0 182; blue: 0 164;


Для каждой тумбы проводим нехитрые вычисления ( r(max-min) + g(max-min) + b(max-min) ):
    765
    765
    765
    733

    711
    551
    713
    547


Как видим, только 4ая тумба отклоняется от идеальных результатов, но тут можно ввести какую-то погрешность (тут = 32).

0
 

Мотиватор :)

С нами с 06.05.09
Сообщения: 3028
Рейтинг: 607

Ссылка на сообщениеДобавлено: 28/03/10 в 15:34       Ответить с цитатойцитата 

Оффтопик: так зарождались фильтры для фотошопа smail101.gif

Just a signature.

0
 



С нами с 01.03.07
Сообщения: 304
Рейтинг: 223

Ссылка на сообщениеДобавлено: 29/03/10 в 11:04       Ответить с цитатойцитата 

alex.raven писал:





Так вот у этой тумбы количество черных и не черных пикселей будет соответствовать качественной тумбе, хотя оригинал так себе

0
 



С нами с 23.10.08
Сообщения: 577
Рейтинг: 141

Ссылка на сообщениеДобавлено: 29/03/10 в 11:27       Ответить с цитатойцитата 

да имхо тут проще человеку поручить. просто сделать вывод тумб штук по 100 и чтоб он выбирал плохие, кликая по ним.

таким макаром несколько тыщь в день для одного не проблема, а человек 5 вобще выдадут огромные объемы. и качество будет на порядок лучше чем скриптом.

0
 

Мотиватор :)

С нами с 06.05.09
Сообщения: 3028
Рейтинг: 607

Ссылка на сообщениеДобавлено: 29/03/10 в 11:46       Ответить с цитатойцитата 

leroy_17 писал:
Так вот у этой тумбы количество черных и не черных пикселей будет соответствовать качественной тумбе, хотя оригинал так себе


ну я жеж сразу оговорился, на чём основан метод и что у него будут погрешности.

хотя у нас применяется другой метод - я написал простой скрипт, который при помощи ajax одним кликом позволяет отбирать более качественные тумбы, которые попадут на главную страницу:



на странице выводится сразу по 500 тумб, опыт показал, что одна девочка за 2-3 часа ненапряженной работы модерирует около 20,000 тумб.

Just a signature.

0
 
Новая тема Новая тема   

Текстовая реклама в форме ответа
Заголовок и до четырех строчек текста
Длина текста до 350 символов
Купить рекламу в этом месте!


Перейти:  



Спонсор раздела Стань спонсором этого раздела!

Реклама на сайте Advertise with us

Опросы

Рецепт новогоднего блюда 2022



Обсудите на форуме обсудить (11)
все опросы »