Category: технологии

Category was added automatically. Read all entries about "технологии".

Нейронные сети - сравнение апскейл алгоритмов.

Много картинок и всего остального...

Апскейл, который смог
Термин «апскейл» используется для обозначения процесса увеличения разрешения цифровых изображений с фокусом на создание иллюзии «настоящего» высокого разрешения. Правда, 90% таких продуктов — это барахло, больше намёк на перспективы, чем волшебство. Недавно мои ручки добрались до двух алгоритмов повышения чёткости, которые оказались настолько хороши, что появилась эта статья. Будут субъективные и объективные тесты алгоритма Real-ESRGAN для увеличения разрешения и алгоритма GFPGAN для детализации лиц.
Обучение алгоритмов производится на относительно ограниченном наборе данных, и на практике рано или поздно встретятся изображения, которые будут неправильно обработаны. Невозможно заранее предсказать ценность алгоритма без тестирования в рамках конкретной задачи, отчётам разработчиков сложно доверять, ведь их задача — «продать» свою работу. Проверка алгоритма должна начинаться с тестирования на данных, которые повстречаются наиболее вероятно. Если первичные результаты удовлетворяют ожиданиям, следует оценить диапазон применимости, подбирая всё более маргинальные варианты. Для оценки качества работы алгоритмов тренированного глаза достаточно, но ради придания статье тончайшего налёта профессионального исследования, сравнение будет сопровождаться количественными оценками.

...

Подборка плат усилителей класса D с хорошим звуком для сборки своего усилителя мощности
Класс D давно уже применялся в портативной и концертной технике, где нужна высокая эффективность и малое выделение тепла. Но теперь, усилители класса D активно внедряются в HiFi компоненты. Оно и понятно, аудиотехника становится меньше, огромные сетевые трансформаторы и радиаторы охлаждения уже не вписать в lifestyle корпуса усилителей.
И инженеры постоянно работают над совершенствованием технологии цифровых ШИМ усилителей. Качество звука современных решений очень высокое, от детских болячек класса D давно избавились.
А инновации и новые технологии постепенно попадают в Китай, а потом, мы можем их купить.
Рассмотрим известные варианты плат современных ШИМ усилителей на площадке AliExpress.

Датчик СО2 на MEMS

TDK представляет революционную МЭМС-платформу для измерения концентрации углекислого газа.
Корпорация TDK выпустила основанную на МЭМС датчике миниатюрную малопотребляющую сенсорную платформу InvenSense TCE-11101 для прямого и точного измерения абсолютной концентрации CO2 в бытовых, медицинских, автомобильных и других приложениях, а также в системах IoT. В TCE-11101 реализована новая технология, укрепляющая лидерство TDK в области датчиков для новых приложений и решений. Устройство стало частью нового семейства SmartEnviro. Его небольшие размеры и сверхнизкая потребляемая мощность позволяют создавать бытовые и коммерческие устройства всех форм и размеров, не нуждающиеся в сетевой розетке. TCE-11101 выпускается в 28-контактном корпусе LGA с размерами 5 мм × 5 мм × 1 мм и требует минимального количества внешних компонентов для создания законченной конструкции.

https://invensense.tdk.com/smartenviro/
https://invensense.tdk.com/news-media/tdk-introduces-revolutionary-mems-based-sensor-platform-for-detecting-co2/

Нейросети в видео. Topaz Video Enhance AI 2.0.0.

Решил тут поиграться с увеличением разрешения. Взял нашего Маугли, т.к. оказывается его нормальный ремастеринг не делали.
Увеличивал покадрово до 4К, т.е. на 400% с помощью алгоритма Артемида версии 11. Он именно для таких материалов предназначен. Скорость 1,5 кад/сек.
Забавно смотреть за происходящим, т.к. ты видишь как строиться кадр и что и как перемещается. Интересно. :)
Параллельно можно работать, но комп дико греется.
Отработав первый блок VOB'а с ДВД пока остановился (40 тысяч кадров, 326 гигабайт).
Вторым шагом - прогоняю через Topaz DeNoise AI, чтобы убрать шум. Пока сделал 50 секунд.
4К уменьшил до FullHD, чтобы скрасть недостатки сильного увеличения.

Результат можете глянуть:
Оригинал DVD 720х576 https://disk.yandex.ru/d/W71alDwaF2uZCg

И увеличение до FullHD через 4К, первые 50 секунд без звука https://disk.yandex.ru/i/B5mbNL4lt6e9bw

В продуктовой линейке ЗАО НТЦ «Модуль» появился серверный вычислитель МС127.05

Модуль необходим для решения задач обработки данных в системах искусственного интеллекта, цифровой обработки сигналов и машинного зрения.
Области применения:
Нейронные сети.
Системы цифровой обработки сигналов и изображений широкого класса.
Робототехника.
Специализированные высокопроизводительные вычислительные комплексы.
Системы машинного зрения.
Образование.
Телекоммуникационные и связные системы.
Искусственный интеллект.
Радиотехнические системы и комплексы.
Автоматизация процессов производства.

Технические характеристики
[Spoiler (click to open)]
Многопроцессорная СнК К1879ВМ8Я (NM 6408):
16 ядер NeuroMatrix 4-го поколения;
5 ядер ARM Сortex A5
Пиковая производительность:
до 512 ГФлопс в формате одинарной точности;
до 128 ГФлопс в формате двойной точности
Максимальная потребляемая мощность не более 30 Вт
Типовая потребляемая мощность 11 Вт
5 ГБ памяти DDR3L с пропускной способностью до 32 ГБ/с
Светодиодная индикация исправности источников питания
Светодиодная индикация (GPIO ядер NMC и центрального ядра ARM)
Стандартный 6 контактный разъём дополнительного питания PCIe
PCIe x4 с пропускной способностью до 4 ГБ/с
Ethernet 100 Мбит/с (с поддержкой протокола EDCL)
microSD
GPIO (28 выводов)
JTAG (20-контактный порт)
Высокоскоростные коммуникационные порты с пропускной способностью до 16 ГБ/с
Номинальное напряжение питания 12 В
Конструктивный форм-фактор PCIe x16, занимающий два слота
Габаритные размеры: 274 мм х 141 мм х 41 мм
Максимальная масса не более 0.41 кг
Температура окружающей среды: 0 °C…+60 °C

Aqara Opple - логические zigbee выключатели, MiHome, Aqara Home, Apple HomeKit Home Assistant

Надеюсь "Умный дом" у мне будет, правда не слишком. :)
Aqara Opple - логические zigbee выключатели, MiHome, Aqara Home, Apple HomeKit Home Assistant

Время от времени возникает необходимость обновления информации по тем или иным устройствам — например расширить количество систем управления и способов интеграции. И в этом обзоре — мы снова поговорим про логические zigbee выключатели Aqara Opple. В качестве объекта для исследования — будет 4х клавишная версия, так как именно про нее я еще не рассказывал, но все сказанное будет справедливо для 2х и 6 клавишных моделей, обзоры на которые я уже делал.

Ну если так, то будем посмотреть...

Если Интел нагнут, то будет весело...

Новый Apple M1, AMD Epyc, AMD Ryzen… Если Intel ничего не предпримет, то мы можем увидеть его закат
То что сейчас происходит — это выбивание стула из под Intel, никак иначе. Еще и AMD может зацепить, хотя они показывают хороший прогресс. Если Intel продолжит свою текущую политику, продолжит считать себя монополией и диктовать цены на свои процессоры, то ее, вероятно, ждет закат. Почему? Я проанализировал первые тесты Apple M1 и они сделали первый серьезный удар.
Сразу скажу… Я не фанат Apple, хоть и пользуюсь Apple MacBook Pro 13 еще 2015 года, а недавно выбирал супруге ноутбук и остановился на Apple MacBook Pro 16, хотя и перебрал множество других недешевых ноутбуков. Я не в восторге от политики компании, от многочисленных багов в MacOS и если бы для меня существовала альтернатива, то я бы с радостью сьехал на Xubuntu. Потому я не являюсь ярым фанатом, потому не пытайтесь меня уличить в предвзятости....


...Apple подняла цены на официальном сайте на версии с Intel процессорами. Для примера, MacBook Pro 16 с Core i9-9880H, 16Gb RAM и 512Gb SSD стоит $2699. В то время как Apple MacBook Air с M1, 16Gb RAM и 512Gb SSD стоит $1499. При почти одинаковой производительности… Базовый Air entry level против топового Pro… Давление ценой и качеством. Что же, это мощный удар...

Современные алгоритмы и нейронные сети.

Исследуя компактные и не очень фотоаппараты смотрел на качество алгоритмов шумоподавления на ISO 3200; 6400; 12800.
С другой стороны часто использую программы пакета TOPAZ AI.
И вот взял на пробу, обработал фото Топазом и сравнил с оригинальным джепегом.
Фотография имеет ISO 3200 и сделана SONY Cybershot rx100 Mark VI.
Полноразмеры открывают по клику.

Оригинал из RAW'а без обработки
ISO 3200 — DSC-RX100M6 — sony_cybershot_rx100_vi_76.jpg

Обработанный Топазом деноиз версия 2.3.3
ISO 3200 — DSC-RX100M6 — sony_cybershot_rx100_vi_76--low-light.jpg

Оригинал от SONY Cybershot rx100 Mark VI
sony_cybershot_rx100_vi_76.jpg

В данной картинке разница следовая, почти незаметная, но Топаз оставляет больше полутонов по факту.
С другой стороны с фотиком не нужно мучатся - просто снимаешь и всё, а с Топазом нужно работать. И разница не настолько велика, чтобы склонять к выбору Топаза.
Хотя я, как "извращенец", лучше сделаю через Топаз или шум фотографии вообще трогать не буду.

Вообщем, современные программы "Форева!"

Это интересно... ИИ и его проблемы.

Что не хватает ИИ?
Это пост-вопрос, в нем я попробовал сформулировать основные проблемы нейросетей, решение которых может сделать прорыв в технологии ИИ. В основном речь о сетях, что работают с текстом (GPT, BERT, ELMO и т.п.). Как известно, хорошая формулировка задачи — половина ее решения. Но сам я эти решения найти не могу. Надеюсь на «помощь зала», так как тут много тех, кто сталкивается с такими же проблемами и возможно «видит» их решение.



Итак.



1. Самое казалось бы простое, но нейросеть не учитывает факты. Нейросеть выучивается на частных фактах, но как бы не знает о них. На когнитивном языке NN обладает семантической, а не эпизодической памятью грубо говоря. Сеть учат выдавать наиболее релевантные ответы, но их база всегда не полна (покрытие никогда не приблизится к 100%).

Решение может есть простое, но нейросеть — классификатор, а прецеденты не могут быть классами, противоречие. Очень часто нужен именно такой ответ от ботов, они очень плохо работают с фактами, если речь не о шаблоном «поставь будильник на… — на сколько ты по ставила будильник?». Проблема усугубляется тем, что всегда есть исключения, которые не может учитывать сеть, если у нее не было достаточно примеров с исключением. А если примеров достаточно — это не исключение. В общем, NN может сказать, что это шляпа, но не может сказать, какая шляпа моя (был только один пример).



[Кому интересно...]2. «Здравый смысл». Известная проблема, названная даже «темной материей ИИ». Есть интересные подходы к решению, например, в этой статье, где описывается попытка совместить символический (логичекий) ИИ и нейросетевые подходы. Но это попытка пойти назад, вместо того чтобы пойти вперед. Проблема же в том, что «здравый смысл» — это неявные знания о мире, которых не было в обучающей датасете. Такие банальности никто даже не произносит, их узнают в 4-6 лет, когда еще не умеют писать. Громкие неудачи проектов Компрено и Cyc показывают, что описать явно все факты невозможно. Они как-то выводятся налету. Хороших идей решения пока нет, кроме ограничения словаря. Например, «школьник» должен «наводить» такие «фильтры» на лексикон ответа, чтобы в выбираемых вариантах не было слов «армия» или «женитьба», если речь идет о нем самом, а не о присутствии на свадьбе старшего брата. Как этой сделать в NN не (мне) понятно.



3. Не менее важной проблемой, а возможно связанной с предыдущей — это проблема построения рассуждений. Нейросети не умеют делать силлогизмы, то есть простейшие выводы с последовательными рассуждениями (промежуточными выводами). Эта же проблема с другой стороны — невозможность преследовать цель рассуждений или хотя бы придерживаться определенного смысла. GPT может построить текст новости на заданную тему, но ей бесполезно говорить, «напиши новость, что бы очернить Х». В лучшем случае она напишет про очернение другими, причем в явном виде, а не как мы, люди, между строк. Вывод силлогизма — это тоже цель — надо соотносить предпосылки с выводом. Иметь его ввиду при первом же высказывании (посылке). Пока даже не понятно, «с какой стороны » это заложить в сеть. Может кто знает?



4. И еще одна проблема, которая даже не темная материя, а черная дыра ИИ. Это аналогии и метафоры. ИИ все понимает только буквально. Ей бесполезно говорить, «похожий на Х». Сеть может дополнить описание, но не описать аналог. Может быть это просто проблема соответствующего датасета. Но мне кажется она глубже и показывает корневой «недостаток» нынешних архитектур ИИ как и п.3. Наш язык сплошь метафоричен, отсюда же произрастает «проклятие лингвистов» — омонимия. Одни и те же лексемы через метафоры используются в куче разных «концептов». И мы легко в этом ориентируемся. Частично это решается в задаче определения интентов, но это опять же определение «темы», а не всего концепта, состоящего не только из названия интента и связанных с ним шаблонов ответов как в ботах.



Пока этих четырех хватит для обсуждения, хотя есть более частные, но не менее важные проблемы в построении ботов, например. Достаточно пообщаться с Алисой и они становятся интуитивно очевидными. Но вот с формулировками их не так все просто — догадаться в чем проблема значит догадаться и о том, как ее решить. С этим труднее. Спасибо за конструктивные комментарии по теме.