dummynet и паника "bad switch -256!"
В продолжение темы.
После того, как Глеб исправил несколько проблем в ядре FreeBSD, нагруженные роутеры с mpd5/PPPoE у меня работают стабильно. Однако, где-то раз в год всё-таки на каком-нибудь из них нет-нет, да и произойдет паника и все следы ведут в dummynet. Но раньше по разным причинам не удавалось сохранить одновременно крешдамп и отладочное ядро, а сегодня-таки удалось.
По итогам предварительного разбирательства найдено подозрительное место в коде dummynet и оформлен PR: https://bugs.freebsd.org/bugzilla/show_bug.cgi?id=195102
Судя по коду, проблема общая и для 9.x, 10.x и CURRENT - это место практически неизменно во всех ветках. Теперь главное, чтобы PR не завис незамеченным на годы.
no subject
Вот у меня pppoe/mpd5, ngcar и dummynet тоже.
Пора на десятку?
no subject
no subject
Но железо не вечно. Оно там уж прилично трудится, нужно переезжать на соседнее железо,
И вот я в раздумьях, чего брать то.
no subject
Для традиционной инсталляции переезд тоже может заключаться в dump/restore.
no subject
no subject
no subject
no subject
no subject
no subject
no subject
no subject
Для дебага лучше всего почитать главу Kernel Debug в Developers Handbook (раньше эта глава была в основном Handbook, зачем убрали в девелоперский, непонятно). Первым делом нужно собрать отладочное ядро (kernel.debug) плюс добавить в его конфиг INVARIANTS/WITNESS/DIAGNOSTICS (для начала можно только INVARIANTS) с тем, чтобы вместо тупого зависания спровоцировать раннюю панику и получить крешдамп, с которым дальше по Handbook поступать.
Из-за высокой вероятности и даже желаемости паники тестовое ядро желательно загружать через nextboot (однократная загрузка тестового ядра), чтобы не получить циклический ребут из-за паники при старте.
no subject
no subject
9.3 или чего там?
no subject
no subject
Я прям не знаю что и делать, я понимаю оно может хорошо.
Но у меня всё поперек.
У меня и привычки, и миилон скриптов всяких и пуппеты, всё лесом пошло.
no subject
no subject
(Anonymous) 2014-11-18 06:41 am (UTC)(link)Использую 8-STABLE - работает отлично. В этом году пытался перейти на 9/10 - при небольшой нагрузке система паниковала стабильно раз в неделю-две.
no subject
no subject
no subject