Category: it

Category was added automatically. Read all entries about "it".

Нейронные сети - сравнение апскейл алгоритмов.

Много картинок и всего остального...

Апскейл, который смог
Термин «апскейл» используется для обозначения процесса увеличения разрешения цифровых изображений с фокусом на создание иллюзии «настоящего» высокого разрешения. Правда, 90% таких продуктов — это барахло, больше намёк на перспективы, чем волшебство. Недавно мои ручки добрались до двух алгоритмов повышения чёткости, которые оказались настолько хороши, что появилась эта статья. Будут субъективные и объективные тесты алгоритма Real-ESRGAN для увеличения разрешения и алгоритма GFPGAN для детализации лиц.
Обучение алгоритмов производится на относительно ограниченном наборе данных, и на практике рано или поздно встретятся изображения, которые будут неправильно обработаны. Невозможно заранее предсказать ценность алгоритма без тестирования в рамках конкретной задачи, отчётам разработчиков сложно доверять, ведь их задача — «продать» свою работу. Проверка алгоритма должна начинаться с тестирования на данных, которые повстречаются наиболее вероятно. Если первичные результаты удовлетворяют ожиданиям, следует оценить диапазон применимости, подбирая всё более маргинальные варианты. Для оценки качества работы алгоритмов тренированного глаза достаточно, но ради придания статье тончайшего налёта профессионального исследования, сравнение будет сопровождаться количественными оценками.

Спамящий бабушкофон.

Вон оно как бывает...

Трояны и бэкдоры в кнопочных мобильных телефонах российской розницы

Немалое количество простых кнопочных телефонов, присутствующих в российских магазинах, содержат нежелательные недокументированные функции. Они могут совершать автоматическую отправку СМС-сообщений или выходить в интернет для передачи факта покупки и использования телефона (передавая IMEI телефона и IMSI SIM-карт). Встречаются модели со встроенным трояном, отправляющим платные СМС-сообщения на короткие номера, текст которого загружается с сервера, также бывают устройства с настоящим бэкдором, пересылающим входящие СМС-сообщения на сервер злоумышленников.
Статья описывает детали вредоносных функций и способы их обнаружения.
Введение
Исследование мобильных телефонов началось с простой идеи: можно ли использовать эти дешевые и доступные в любом магазине трубки для приёма СМС-сообщений на компьютер? Телефоны гораздо дешевле распространённых USB GSM-модемов, к тому же большинство моделей поддерживают 2 SIM-карты, а некоторые и до четырёх.
В силу почти полного отсутствия информации о наличии и возможностях AT-порта в современных телефонах, я решил купить несколько максимально разных устройств для проверки их функциональности.
Но как выбрать по-настоящему разные телефоны?

Samsung NX2000 ДУ USB


Вздрогнем!..

Будете смеяться, но камера работает на Линуксе!
И вроде бы море возможностей для всяких твиков, но у нас же Капитализм! Так что Самсунгу пришлось всё скрыть от шаловливых ручёнок.
И така простая приблуда, как таймер интервальной съёмки тоже нельзя програмно прикрутить... вернее нет хороших товарищей программистов... Всё что смогли, это убрали 30 минутное ограничение для видео и то на этом фотике оно не работает. :) Зато можно подключиться по Телнету. :)))

lumixograf не хотите помочь? Там всего 2 гигабайта всего. :)))
Если чо, я шучу.

Из-за этого приходится шелудить руками, опять, и искать схемы.
Порт управления всё тот же USB.


Теперь нужно объединить интервальный пульт и питание по USB.

P.S. Видео кстати паршивое, слишком сильное сжатие. Обработка делается "выкидыванием строк" для быстроты, это видно по проводам. Это упирается в процессор.
А также кодек странный со странными артефактами. Ну и дышаший автофокус тут неизбежен, т.к. фокусировка контрастная. Но есть правильная ручная фокусировка.
Вот https://disk.yandex.ru/i/Aw8eIm0vzycnMw 34 мегабайта. Тут ручной фокус, потому дыхания нет, но всё остальное в наличии.
Видео мне не к чему, но для общего представления пишу об этом.
Говорят многое в видео исправили в 300-й и выше сериях.

В продуктовой линейке ЗАО НТЦ «Модуль» появился серверный вычислитель МС127.05

Модуль необходим для решения задач обработки данных в системах искусственного интеллекта, цифровой обработки сигналов и машинного зрения.
Области применения:
Нейронные сети.
Системы цифровой обработки сигналов и изображений широкого класса.
Робототехника.
Специализированные высокопроизводительные вычислительные комплексы.
Системы машинного зрения.
Образование.
Телекоммуникационные и связные системы.
Искусственный интеллект.
Радиотехнические системы и комплексы.
Автоматизация процессов производства.

Технические характеристики
[Spoiler (click to open)]
Многопроцессорная СнК К1879ВМ8Я (NM 6408):
16 ядер NeuroMatrix 4-го поколения;
5 ядер ARM Сortex A5
Пиковая производительность:
до 512 ГФлопс в формате одинарной точности;
до 128 ГФлопс в формате двойной точности
Максимальная потребляемая мощность не более 30 Вт
Типовая потребляемая мощность 11 Вт
5 ГБ памяти DDR3L с пропускной способностью до 32 ГБ/с
Светодиодная индикация исправности источников питания
Светодиодная индикация (GPIO ядер NMC и центрального ядра ARM)
Стандартный 6 контактный разъём дополнительного питания PCIe
PCIe x4 с пропускной способностью до 4 ГБ/с
Ethernet 100 Мбит/с (с поддержкой протокола EDCL)
microSD
GPIO (28 выводов)
JTAG (20-контактный порт)
Высокоскоростные коммуникационные порты с пропускной способностью до 16 ГБ/с
Номинальное напряжение питания 12 В
Конструктивный форм-фактор PCIe x16, занимающий два слота
Габаритные размеры: 274 мм х 141 мм х 41 мм
Максимальная масса не более 0.41 кг
Температура окружающей среды: 0 °C…+60 °C

Современные алгоритмы и нейронные сети.

Исследуя компактные и не очень фотоаппараты смотрел на качество алгоритмов шумоподавления на ISO 3200; 6400; 12800.
С другой стороны часто использую программы пакета TOPAZ AI.
И вот взял на пробу, обработал фото Топазом и сравнил с оригинальным джепегом.
Фотография имеет ISO 3200 и сделана SONY Cybershot rx100 Mark VI.
Полноразмеры открывают по клику.

Оригинал из RAW'а без обработки
ISO 3200 — DSC-RX100M6 — sony_cybershot_rx100_vi_76.jpg

Обработанный Топазом деноиз версия 2.3.3
ISO 3200 — DSC-RX100M6 — sony_cybershot_rx100_vi_76--low-light.jpg

Оригинал от SONY Cybershot rx100 Mark VI
sony_cybershot_rx100_vi_76.jpg

В данной картинке разница следовая, почти незаметная, но Топаз оставляет больше полутонов по факту.
С другой стороны с фотиком не нужно мучатся - просто снимаешь и всё, а с Топазом нужно работать. И разница не настолько велика, чтобы склонять к выбору Топаза.
Хотя я, как "извращенец", лучше сделаю через Топаз или шум фотографии вообще трогать не буду.

Вообщем, современные программы "Форева!"

WebP и хранение фотографий.

Формат WebP создан Гуглом достаточно давно, но нормальная поддержка произошла, грубо говоря, "только вчера".
Как всегда, не хватает места на винтах и начинаешь его изыскивать. Я решил пожать сильнее не слишком нужные фотки и панорамы, как самые множественные первые и как самые большие по объёму вторые. Вот тут начал сравнивать WebP с JPEG2000. Разница между форматами по размеру почти нулевая, а вот по визуальному восприятию сильно разная. Разница видна при крайне агрессивном сжатии и WebP её выигрывает полностью. Есть "коридор" где всё находится в шатком равновесии (артефакты сжатия и размер файла). Это примерно значения от 15 до 40 из 100. Я использовал 20 и мне хватало.
Выйгрыш по размеру - ~50% от джепега. Лучший кодер на данный момент по совокупности в ИрфанВью (у меня версия 4.54)

Недостатки формата:
1. т.к. это "огрызок" видеокодера, то тут цветовое пространство  YUV да ещё кодирование 4:2:0 с потерей цветового охвата... Но текущий кодер Ирфана вроде бы нормальные цвета даёт... (посмотрите как у вас будет отображаться).
2. Ограничение на 16000 пикселей, что для панорам маловато, нужно хотя бы 30 тыщ.
3. Кодирует долго, просматривает быстро. Относительный минус, но...

Вот примеры https://yadi.sk/d/_ksurSMhFwyATg
Смотрите на розовую шапочку девочки. Мелочи тут полно: от иголок до шума фотика.

...Да, что я получил? В результате освободил почти 700 гигов. Фоток было 3 ТБ - стало 2,3 ТБ. И я не трогал RAW'ы!!!  Люблю я их... :)))
Чтобы предвосхитить вопросы - храню на трёх винтах одновременно, синхронизация ручная от GoodSync.

Машинное зрение vs интуиция человека

https://habr.com/ru/company/ua-hosting/blog/445372/
Проведенная работа дала ученым возможность сделать простой и достаточно очевидный вывод — человеческая интуиция может быть источником очень важных данных и инструментом в принятии правильного решения и/или восприятия информации. Человек способен интуитивно понять как будет вести себя система распознавания объектов, какие метки она выберет и почему.

Причин почему человеку проще увидеть реальное изображение и правильно его распознавать несколько. Самой очевидной является метод получения информации: машина получает изображение в цифровом виде, а человек видит ее своими собственными глазами. Для машины картинка это набор данных, внеся изменения в которые, можно исказить ее классификацию. Для нас же изображение поезда метро всегда будет поездом метро, а не банкой молока, потому как мы видим это.

Ученые также делают ударение на том, что подобные тесты достаточно сложно оценивать, ибо человек это не машина, а машина — не человек. К примеру, исследователи говорят о тесте с «бубликом» и «колесом». Эти изображения похожи на «бублик» и «колесо», потому система распознавания так их и классифицирует. Человек же видит, что они похожи на «бублик» и «колесо», но ими не являются. В этом заключается фундаментальная разница восприятия визуальной информации между человеком и программой.

Сергей Марков: "Искусственный интеллект и машинное обучение: итоги 2018 ...

Но озвученное строение синапсов и близко не идёт к реальности. Самое грустное для всех мечтателей ИИ - что связи в мозге перестраиваются постоянно, а в электронике - нет.

Очередная "Революция в шумоподавлении"

Не знаю, но посмотрим, может что-то наконец "выстрелит" из всей этой нейронной дребедени...

Примеры очень вкусные...

Ревоюция в шумоподавлении



Ха... есть ссылка на код, но требования для обучения пипец...
ГитХаб

DSP по звуку. Приятные возможности.

Нечаянно наткнулся на видео с "Чип и Дип" #1 Цифровая обработка звука ADAU1701 | Открытый проект | Начало
И тут "накрыло" всякими воспоминаниями по поводу этой темы. Решил проверить, что творится в наше время на этом фронте, нашёл что много хорошего и интересного.
Collapse )