Підвищуючи точність моделей комп’ютерного зору, Voxel51 збирає 12,5 мільйонів доларів

Не змогли відвідати Transform 2022? Перегляньте всі сесії саміту в нашій бібліотеці за запитом! Подивіться сюди.

Моделі штучного інтелекту комп’ютерного зору покладаються на правильно позначені дані, щоб визначити правильний об’єкт. Завдання допомоги у перевірці того, що дані, які використовуються для моделі, є точними, – це те, що Voxel51, стартап із Енн-Арбор, штат Мічиган, прагне вирішити за допомогою інструментів з відкритим кодом і комерційної служби під назвою FiftyOne Teams. /p>
Енн-Арбор є домом для Мічиганського університету, де співзасновник і генеральний директор Voxel51 Джейсон Корсо працює професором, і де він отримав ідею нової компанії. Дослідження Corso зосереджені на програмах комп’ютерного зору, таких як зв’язок між відео та природною мовою. Останніми роками у міру впровадження комп’ютерного зору зростає розмір наборів даних.

«Коли я був аспірантом, у мене були набори даних, які налічували десятки, і я міг переглянути кожен зразок», — сказав Корсо VentureBeat. «Тепер мої студенти прибули, і вони не можуть дивитися мільйон зразків; це просто неможливо, тому потреба у Voxel51 виросла з цього».

Це потреба знайшла резонанс серед ринку та інвесторів. Сьогодні компанія оголосила, що залучила 12,5 мільйонів доларів у рамках фінансування серії A від Drive Capital, Top Harvest і Shasta Ventures, а також від існуючих інвесторів eLab Ventures і ID Ventures і Мічиганського університету.
Подія
MetaBeat 2022

4 жовтня в Сан-Франциско, штат Каліфорнія, MetaBeat збере лідерів думок, щоб порадити, як технологія метавсесвіту змінить спосіб спілкування та ведення бізнесу в усіх галузях.
зареєструватися тут Виклик і можливості неструктурованих даних для комп’ютерного зору
Неструктуровані дані мають багато форм і містять будь-які типи даних, які не вписуються в певний формат структури даних (наприклад, стовпці та рядки).

Серед найпоширеніших форм неструктурованих даних є відеоконтент, який експоненціально зростає, оскільки кількість камер продовжує зростати в усьому світі. Оцінку неструктурованих відеоданих можна виконати різними способами. Корсо зазначив, що існують технології, які допомагають користувачам отримувати семантично значущу інформацію із зображень, наприклад прості інструменти, які дозволяють користувачам шукати зображення, зроблені в певному місці.

Хоча немає дефіциту неструктурованих даних зображень і великих наборів даних, які використовуються для навчання моделей комп’ютерного зору, забезпечення точності є проблемою.

"Все, що ми повинні сказати, це те, що коли набори даних зросли до понад 10 мільйонів зразків, ніхто більше не потрудився дивитися на зображення", - сказав Корсо.
p>
Те, що робить Voxel51, — це сполучна ланка між тим, що робить інженер даних під час створення наборів даних, і тим, що той самий інженер або його партнер робить під час навчання моделей. Технологія Voxel51 підтримує перегляд анотацій у даних зображення та може використовуватися для виявлення потенційних помилок і дозволяє користувачам порівнювати продуктивність різних моделей.

Корсо пояснив, що Voxel51 дозволяє користувачам семантично розділяти дані, щоб зрозуміти точність моделі. Наприклад, за допомогою API Python користувач може запустити запит до набору даних комп’ютерного зору, щоб знайти всі зображення, де одна модель перевершує іншу, для зображень, де дитина біжить вулицею.
Відкритий код і підприємство
Voxel51 починався як продукт із відкритим кодом, але разом із оголошенням про фінансування компанія офіційно запускає корпоративну пропозицію FiftyOne Teams, яка надає комерційну підтримку та додаткові функції.

Проект із відкритим вихідним кодом Voxel51 було вперше запущено в серпні 2020 року та розширився протягом...

Стартапи Sep 21, 2022 0 38 Add to Reading List

Підвищуючи точність моделей комп’ютерного зору, Voxel51 збирає 12,5 мільйонів доларів

Не змогли відвідати Transform 2022? Перегляньте всі сесії саміту в нашій бібліотеці за запитом! Подивіться сюди.

Моделі штучного інтелекту комп’ютерного зору покладаються на правильно позначені дані, щоб визначити правильний об’єкт. Завдання допомоги у перевірці того, що дані, які використовуються для моделі, є точними, – це те, що Voxel51, стартап із Енн-Арбор, штат Мічиган, прагне вирішити за допомогою інструментів з відкритим кодом і комерційної служби під назвою FiftyOne Teams. /p>

Енн-Арбор є домом для Мічиганського університету, де співзасновник і генеральний директор Voxel51 Джейсон Корсо працює професором, і де він отримав ідею нової компанії. Дослідження Corso зосереджені на програмах комп’ютерного зору, таких як зв’язок між відео та природною мовою. Останніми роками у міру впровадження комп’ютерного зору зростає розмір наборів даних.

«Коли я був аспірантом, у мене були набори даних, які налічували десятки, і я міг переглянути кожен зразок», — сказав Корсо VentureBeat. «Тепер мої студенти прибули, і вони не можуть дивитися мільйон зразків; це просто неможливо, тому потреба у Voxel51 виросла з цього».

Це потреба знайшла резонанс серед ринку та інвесторів. Сьогодні компанія оголосила, що залучила 12,5 мільйонів доларів у рамках фінансування серії A від Drive Capital, Top Harvest і Shasta Ventures, а також від існуючих інвесторів eLab Ventures і ID Ventures і Мічиганського університету.

Подія

MetaBeat 2022

4 жовтня в Сан-Франциско, штат Каліфорнія, MetaBeat збере лідерів думок, щоб порадити, як технологія метавсесвіту змінить спосіб спілкування та ведення бізнесу в усіх галузях.

зареєструватися тут Виклик і можливості неструктурованих даних для комп’ютерного зору

Неструктуровані дані мають багато форм і містять будь-які типи даних, які не вписуються в певний формат структури даних (наприклад, стовпці та рядки).

Серед найпоширеніших форм неструктурованих даних є відеоконтент, який експоненціально зростає, оскільки кількість камер продовжує зростати в усьому світі. Оцінку неструктурованих відеоданих можна виконати різними способами. Корсо зазначив, що існують технології, які допомагають користувачам отримувати семантично значущу інформацію із зображень, наприклад прості інструменти, які дозволяють користувачам шукати зображення, зроблені в певному місці.

Хоча немає дефіциту неструктурованих даних зображень і великих наборів даних, які використовуються для навчання моделей комп’ютерного зору, забезпечення точності є проблемою.

"Все, що ми повинні сказати, це те, що коли набори даних зросли до понад 10 мільйонів зразків, ніхто більше не потрудився дивитися на зображення", - сказав Корсо.

Те, що робить Voxel51, — це сполучна ланка між тим, що робить інженер даних під час створення наборів даних, і тим, що той самий інженер або його партнер робить під час навчання моделей. Технологія Voxel51 підтримує перегляд анотацій у даних зображення та може використовуватися для виявлення потенційних помилок і дозволяє користувачам порівнювати продуктивність різних моделей.

Корсо пояснив, що Voxel51 дозволяє користувачам семантично розділяти дані, щоб зрозуміти точність моделі. Наприклад, за допомогою API Python користувач може запустити запит до набору даних комп’ютерного зору, щоб знайти всі зображення, де одна модель перевершує іншу, для зображень, де дитина біжить вулицею.

Відкритий код і підприємство

Voxel51 починався як продукт із відкритим кодом, але разом із оголошенням про фінансування компанія офіційно запускає корпоративну пропозицію FiftyOne Teams, яка надає комерційну підтримку та додаткові функції.

Проект із відкритим вихідним кодом Voxel51 було вперше запущено в серпні 2020 року та розширився протягом...