Реактор образовательный: поиск ошибок в коде на раннем этапе / C# :: c++ :: программирование :: реактор образовательный :: it :: geek (Прикольные гаджеты. Научный, инженерный и айтишный юмор)

Реактор образовательный: поиск ошибок в коде на раннем этапе

Каждый программист знает об отладчике, системе контроля версий или, например, юнит-тестах. Но далеко не все программисты знакомы с методологией статического анализа кода. А тем временем, эта технология становится неотъемлемой частью цикла разработки программ. Предлагаю небольшой ликбез для всех, кто интересуется современными тенденциями разработки.

$16,000
Процент
ошибок
% Дефектов, найденных на этом этапе
% Дефектов, найденных на этом этапе
$ Стоимость исправления дефекта на этом этапе
Написание ЦпК-тест Функциональный Системный После релиза
кода
тест
тест,программирование,it,c++,C#,реактор образовательный,geek,Прикольные гаджеты.

Чем раньше ошибка выявлена, тем дешевле её исправление. Именно поэтому, например, появилась методология TDD (разработка через тестирование), в которой тесты пишутся до реализации очередной функции.

Ещё одна методология, позволяющая выявить ошибку на раннем этапе, это обзор кода. Грубо говоря, после написания кода программист показывает его коллеге, и тот его проверяет. Это, конечно, "деревенский подход". Полноценный обзор кода — это целый процесс, который хорошо описан, например, в книге С. Макконнелла "Совершенный код". Кстати, каждый, кто называет себя хорошим программистом, просто обязан почитать эту книгу.

И вот методология обзора кода стала подводить. Вернее, методология работает по-прежнему хорошо, но становится всё более дорогой. Собственно, вспомните, когда последний раз ваши свежие функции честно прочитала группа из четырёх программистов, выдала рекомендации, а потом собралась ещё раз, чтобы посмотреть измененный код? А было ли вообще хоть раз такое?

Причина дороговизны в росте размера программного кода и экспоненциальном росте сложности его анализа человеком. Дело в том, что с ростом проекта сложность и количество ошибок растёт нелинейно.

Размер проекта (число строк кода)
менее 2К 2К-16К 16К-64К 64К-512К
512К и более
Типичная плотность ошибок
0-25 ошибок на 1000 строк кода 0-40 ошибок на 1000 строк кода 0.5 - 50 ошибок на 1000 строк кода 2-70 ошибок на 1000 строк кода 4 - 100 ошибок на 1000 строк

20-30 лет назад можно было взять и проверять весь код на обзорах, а сейчас это неприемлемо сложно и дорого. Просто, для пояснения, приведу два числа:

Количество строк кода в первом компиляторе C++ (Cfront 1.0): 85 KLOC. Количество строк кода в современном компиляторе Clang (без учёта LLVM): 1700 KLOC.

И вот здесь на помощь пришел статический анализ кода. Идея в том, что обзор кода выполняет не человек, а программа. Да, программа проверит код хуже, чем 4 пары внимательных глаз. Только вот нет этих глаз. Код некому и некогда читать. Поэтому использование статических анализаторов - очень хорошая альтернатива.

Да, многие ошибки статические анализаторы не находят. Это сложные экспертные системы, но не искусственный интеллект. Зато они не устают, у них всегда есть время проверить ваш код. Более того, в них закладывается огромное количество знаний об ошибочных паттернах, и они способны выявить ошибку, о существовании которой программист может не знать. Так что иногда статический анализ даже превосходит разработчика.

Приведу пример для С++ программистов. Пусть мы имеем цикл, организованный с помощью итераторов. Если в нём изменить контейнер, то итераторы станут невалидными. Это является ошибкой: возникает неопределённое поведение программы. Про это написано в книгах по программированию. Новый стандарт языка C++ подарил программистам range-based for loop. Это менее знакомая конструкция, и, как результат, велик шанс, что будет написан вот такой код:

$using Strings = std::vector<std::string>; int mainEntryClickhousePerformanceTest(int argc, char ** argv) { Strings input_files; for (const String filename : input_files) { FS::path file(filename); if (!FS::exists(file)) throw DB: : Exception(....); if (FS::is_directory(file) ) {$

Так делать нельзя. Для реализации range-based for loop компилятор использует всё те же итераторы. Только они скрыты от нашего взгляда. И после удаления элементов из контейнера итераторы становятся невалидными.

Статический анализатор кода знает о таком паттерне ошибки и выявляет его. Приведенный выше фрагмент кода был выявлен с помощью анализатора PVS-Studio в коде СУБД ClickHouse, которую разрабатывает компания Яндекс для решения задач Яндекс.Метрики. Подробности можно почитать в статье: https://habrahabr.ru/company/pvs-studio/blog/337182/

Существует множество статических анализаторов кода для различных языков программирования. Google поможет найти и познакомиться с ними. Я предлагаю обратить внимание на популярный на Хабре инструмент — PVS-Studio. Это мощный статический анализатор для поиска ошибок и потенциальных уязвимостей в коде на языке C, C++, C#. Работает в Windows и Linux. Платный, но есть варианты бесплатного лицензирования.

Инструмент хорошо ищет разыменования нулевого указателя, неопределённое поведение, 64-битные ошибки и так далее. Но особенно он хорош при поиске различных опечаток и неудачного copy-paste. Про такие ошибки обычно говорят, что их можно найти за 5 секунд. Поэтому авторы анализатора даже создали ресурс для троллинга таких товарищей.

$This error was found in the Qt project by PVS-Studio C/C++ static code analyzer. 5 of 15 questions QQuickJSContext2DPrototype::method_getImageData(....) { qreal x = ctx->callData->args[0].toNumber(); qreal y = ctx->callData->args[1].toNumber(); qreal w = ctx->callData->args[2].toNumber();$

Критикам предлагается найти ошибки (которые находит PVS-Studio) не за 5, а аж за целых 60 секунд. Попробовать себя можно: https://habrahabr.ru/company/pvs-studio/blog/237219/. Предупреждаю сразу, что тест на телефонах работает плохо и рассчитан на наличие компьютерной мышки.

Статический анализ не конкурирует с другими методами борьбы с ошибками, а дополняет их. Отчёт инструментов статического анализа напоминает предупреждения компилятора, но реализован на более качественном уровне. И именно за эту мощь они берут деньги. Аналогия: есть Paint и Gimp, но Photoshop и CorelDRAW очень востребованы. Специализированные утилиты не только более глубоко анализируют код, но и предоставляют массу вспомогательных механизмов для работы с предупреждениями.

программирование,it,c++,C#,реактор образовательный,geek,Прикольные гаджеты. Научный, инженерный и айтишный юмор

Желающим узнать больше, запрос "статический анализ кода" в Google путь покажет.

Подробнее
$16,000 Процент ошибок % Дефектов, найденных на этом этапе % Дефектов, найденных на этом этапе $ Стоимость исправления дефекта на этом этапе Написание ЦпК-тест Функциональный Системный После релиза кода тест тест
Размер проекта (число строк кода) менее 2К 2К-16К 16К-64К 64К-512К 512К и более Типичная плотность ошибок 0-25 ошибок на 1000 строк кода 0-40 ошибок на 1000 строк кода 0.5 - 50 ошибок на 1000 строк кода 2-70 ошибок на 1000 строк кода 4 - 100 ошибок на 1000 строк кода
using Strings = std::vector<std::string>; int mainEntryClickhousePerformanceTest(int argc, char ** argv) { Strings input_files; for (const String filename : input_files) { FS::path file(filename); if (!FS::exists(file)) throw DB: : Exception(....); if (FS::is_directory(file) ) { __________________________________ input_files.erase( std::remove(input_files.begin(), input_files.end() , filename) , input_files.end() ); getFilesFromDir(file, input_files, recursive); } else { if (file.extension().string() != ".xml") throw DB: : Exception(....); } } }
This error was found in the Qt project by PVS-Studio C/C++ static code analyzer. 5 of 15 questions QQuickJSContext2DPrototype::method_getImageData(....) { qreal x = ctx->callData->args[0].toNumber(); qreal y = ctx->callData->args[1].toNumber(); qreal w = ctx->callData->args[2].toNumber(); qreal h = ctx->callData->args[3].toNumber(); if (!qlsFinite(x) I I !qlsFinite(y) I I !qlsFinite(w) I I !qlsFinite(w)) V4THROW_DOM(DOMEXCEPTION_NOT_SUPPORTED_ERR, "getlmageData(): Invalid arguments"); } f 58 seconds left Ï Don’t know

программирование,it,c++,C#,реактор образовательный,geek,Прикольные гаджеты. Научный, инженерный и айтишный юмор

Еще на тему

программирование(878)

c++(74)

C#(37)

реактор образовательный(917)

geek(16810)

Развернуть

Комментарии 3329.09.201716:32ссылка1.3

Автора похоже не пустили на Хабр

m_slick 29.09.201716:41 ответить ссылка 7.2

Судя по аве он там пишет давно.

Gilbert13 29.09.201716:47 ответить ссылка ↑ 2.7

Как-раз таки наоборот - https://habrahabr.ru/users/Andrey2008/ . Но вот с чего вдруг PVS-Studio рекламится на Реакторе, мне не понятно.

КорейскийМайонез 29.09.201716:48 ответить ссылка ↑ 4.4

Здесь немало постов по программированию. Думаю, дай загляну на огонёк.

Andrey_Karpov 29.09.201716:51 ответить ссылка ↑ 1.0

Действительно а почему бы и не посмотреть друг на друга для начала.

TEXHO3ABPA 29.09.201717:17 ответить ссылка ↑ 3.2

Хочу ИИ, который будет проанализирует уже найденные уязвимости/закладки в открытых исходниках,
и на основе этого научится находить уязвимости/закладки в новом коде.
Такой ИИ будет проводить аудит кода.

А ещё чтобы ИИ указывал, где человек применил анти-паттерны, где код запутан,
и места где можно упростить код, для лучшей поддержки новыми сотрудниками.

refefe 29.09.201718:40 ответить ссылка ↑ 0.0

Боюсь, такой ИИ скорее сам напишет код, и программисты уже будут не нужны.

twilightsparkle 29.09.201718:45 ответить ссылка ↑ 1.3

Ну хз. Мне кажется легче написать ИИ, который проводит анализ кода на уязвимости и его рефакторинг, чем ИИ который самостоятельно пишет код. В первом случае достатоно системы с определенным количеством патернов. Во втором же нужно решить кучу проблем, наичиная с описанием тз для ИИ и заканчивая настройкой кучи мелких параметров.

OneUser 29.09.201718:55 ответить ссылка ↑ 0.4

Боюсь, оба случая на данный момент недостижимы, так что нет смысла спорить, какой ИИ будет проще сделать.

twilightsparkle 29.09.201718:57 ответить ссылка ↑ 0.0

С Хабром всё в порядке. А вот joyreactor я незаслуженно обходил.

Andrey_Karpov 29.09.201716:49 ответить ссылка ↑ 0.5

Лол. Уже который день вижу этот пост в рекламе реактора

TrueOlolo 29.09.201716:53 ответить ссылка ↑ 1.0

На самом деле тут действительно довольно много программистов\околопрограммистов. Но все они, я думаю, вполне себе сидят на хабре\гиктаймс, и в курсе PVS-Studio и статического анализа кода. А основная масса посетителей тут всё-таки скорее ради сисек и смешнявок.

P.S. А на другие языки не планируете расширяться? Golang, например?

twilightsparkle 29.09.201717:00 ответить ссылка ↑ 1.0

В потенциальных планах Java. На Java написано много банковского ПО и т.п.

Andrey_Karpov 29.09.201717:02 ответить ссылка ↑ 1.1

ссылка 29.09.201717:09 ответить ссылка ↑ -1.2

Ну да, Java - большой рынок, go всё-таки достаточно нишевый. Жалко.

twilightsparkle 29.09.201717:12 ответить ссылка ↑ 0.0

нафига козе баян?
даже в яве статический анализ уже не так полезен, не говоря уже про более новые языки, которые и запроектированы были так, чтоб типичные косяки избегать, и системы типов более человеческие там есть, да и элементы статического анализа в самом компиляторе могут быть, а не прилеплены сбоку

villy 29.09.201717:54 ответить ссылка ↑ 0.0

Какая бы польза ни была, она ненулевая. Неочевидно, но глупо накосячить можно где угодно, а машина, глядишь, что-то и выцепит до того, как оно обросло зависимым кодом и ушло в продакшен. Особенно на больших проектах актуально, где тяжело code review над всем кодом проводить. Да и вообще, и code review, и юнит-тесты, и статический анализ всех дыр не закроют, но в сумме они закроют больше дыр, чем каждый в отдельности. Тем более, что статический анализ не требует особо ничего (ну кроме оплаты лицензии в случае с PVS).

twilightsparkle 29.09.201718:42 ответить ссылка ↑ 0.0

Ну такое. Я рад когда на реакторе попадаются годные серьёзные статьи на интересующие меня темы.

ALD960 29.09.201719:04 ответить ссылка ↑ 0.0

Донор Мозга 29.09.201717:40 ответить ссылка -1.4

Это что же получается, когда разработчики станут писать код без багов, перестанут нужны быть тестировщики?..

totosha 29.09.201718:34 ответить ссылка 0.0

Скорее прилетят рептилоиды с Нибиру, чем разработчики станут писать код без багов)

OneUser 29.09.201718:37 ответить ссылка ↑ 0.8

Не боись, всегда можно накосячить на более высоком уровне.

twilightsparkle 29.09.201718:48 ответить ссылка ↑ 1.3

Почему в графике две полоски одинаково подписаны?

psys 29.09.201718:45 ответить ссылка 0.1

Прошу прощения, на первом графике опечатка. Синяя полоса - кол-во дефектов, внесённых на этапе, а не найденных. Виновный будет наказан в понедельник суровым начальственным взглядом.

Andrey_Karpov 29.09.201719:29 ответить ссылка ↑ 0.6

У pvs новый маркетолог

cynic 29.09.201719:01 ответить ссылка 0.0

Нет. С вами я, старый добрый Андрей Карпов. Просто я адаптируюсь к интернету, расширяю кругозор. И готов к обсуждению программистских тем.

Andrey_Karpov 29.09.201719:38 ответить ссылка ↑ 1.3

Update.
Прошу прощения, на первом графике опечатка. А поправить пост уже не могу.
Синяя полоса - кол-во дефектов, внесённых на этапе, а не найденных.

Andrey_Karpov 29.09.201719:22 ответить ссылка 0.0

Пиздец, это говно и до Джоя добралось.
Говнокодер-виндузятник опять пиарит своё недоподелие, которое ищет ошибки хуже clang'овского анализатора.

Gyromitra 29.09.201720:25 ответить ссылка 0.1

Находим ошибки в коде компилятора Clang с помощью PVS-Studio. Уже есть три части:
https://www.viva64.com/ru/b/0108/
https://www.viva64.com/ru/b/0155/
и самое свежее - https://www.viva64.com/ru/b/0446/
Ещё аргументы? :)

Andrey_Karpov 29.09.201720:30 ответить ссылка ↑ 0.3

Ты свои синтетические тесты можешь засунуть себе в свою ненасытную жопу, Андрюшенька. Твой продукт говно и твой постоянный спам только подтверждает, что покупателей такого говна мало. С ЛОРа тебя уже послали нахуй, с Реактора пошлют ещё быстрее.

Gyromitra 29.09.201720:36 ответить ссылка ↑ 0.4

Подожди, давай по порядку. Вот, например, конкретная статья https://www.viva64.com/ru/b/0446/ в котором продемонстрированы реальные ошибки, найденные мною в коде Clang.
Какие синтетические тесты? Я ненавижу синтетические тесты! Proof: https://www.viva64.com/ru/b/0471/

Andrey_Karpov 29.09.201720:40 ответить ссылка ↑ 0.0

Тебе фидбэк по косякам твоего поделия нужен? Ищи бесплатных тестеров где-нибудь в другом месте.

Gyromitra 29.09.201720:45 ответить ссылка ↑ 0.0

Мне нужна популяризация статического анализа кода в широких слоях программистов.
Во сказанул...

Andrey_Karpov 29.09.201721:08 ответить ссылка ↑ 0.0

Только зарегистрированные и активированные пользователи могут добавлять комментарии.

Похожие темы

Фендомы

Чистилище Реактора

Всё самое интересное

VivzieVerse

Тренды

Fallout

приколы для полных дегенератов

Дрочибельные мемы

Похожие посты

подробнее»

Луковичные сети. База.
Для начала поймем как работает луковичная сеть:
[ИЗЧасть 2.
Пользователь Тог Ваня уж очень хочет посмотреть на трапов, для этого он ставит Тог.
Далее, уже сам Тог-клиент подключается к серверу, который является входным узлом Тог сети. Следующим действием с клиентом делятс

подробнее»

	it-юморРейтинг: 98,185.7
	программированиеРейтинг: 16,318.6
	geek pornРейтинг: 2,854.0
	матанРейтинг: 2,576.4
	Приколы для математиковРейтинг: 1,741.6

	butcherboy
	Romana
	mr.takealook
	robishi
	fangs