Перейти к публикации

Таблица лидеров

  1. Nazar

    Nazar

    Пользователи


    • Баллы

      3

    • Публикации

      13 577


  2. rx303

    rx303

    Пользователи


    • Баллы

      2 087

    • Публикации

      1 355


  3. AliraSirin

    AliraSirin

    Пользователи


    • Баллы

      5 813

    • Публикации

      5 849


Популярные публикации

Отображаются публикации с наибольшей репутацией на 19.03.2019 в Комментарии к событиям

  1. до

    Это кстати, довольно распространенная ошибка в статистической географии. Я про оценку матчапов. С такой выборкой и не имея никакой обучающей выборки нормального размера, оценить матчап даже примерно невозможно. Классификация может давать семантически понятный результат, когда у тебя есть эталон или база наблюдений. У нас ничего такого нет. Нужно искать/придумывать/получать больше переменных, чтобы можно было более сложные виды анализа применять. На той выборке, которая есть сейчас, хоть ты все гп за год подними, получить повторяемый и достоверный результат просто невозможно методически. как пример могу привести дихотомическую классификацию спектральной информации ддз для оценки породного состава лесных массивов. Вот ты ее провел, вот у тебя х классов. Вот ты решаешь, что это одна...
    2 балла
  2. до

    Интересно, только какая цель в построении такого рейтинга и матчапов? Какой смысл в проецировании успешности отдельных игроков в одних матчапах на другие матчапы? Чтобы показать, что сильные игроки играют хорошо против всех? Ну да, но к матчапам колод это не имеет отношения. Более того создает картину, которая сбивает с толку. "Но точность предсказания для колод с небольшим количеством игр будет, разумеется, невелика." То есть для колод с большим количеством игр точность велика? Самая представленная колода Иззет Фениксы имеет по этой таблице всего 9 из 49 плюсовых матчапов. Ну да, она играла много игр сама с собой, поэтому не повышала свой рейтинг и его нельзя спроецировать в плюс на другие матчапы....
    2 балла
  3. до

    спасибо, так понятнее. Я просто никогда не работал без относительно правдоподобной нулевой гипотезы, потому что это очень много времени занимает бестолку, а может в моей области с этим попроще просто. По сабжу: я тут почитал вайтпапер от мелкомягких и могу сказать следующее - их трускил - это по факту биграфы, которые моделируют распределение каких-то показателей скила отдельных игроков на основании результатов команды, причем основание - это экспериментальные данные, которые просто подтвердили одну из рабочих моделей. Короче, это блекбокс, который вполне может и не работать, просто мы об этом не знаем, вот. короче, задача решаемая, но просто обработки данных на пару недель, а мета меняется и факторы заново забивать надо... Вот...
    1 балл
  4. до

    Методология (осторожно, много эльфийского): Рейтинг по Эло считается по формуле На самом деле, это частный случай классического приема из машинного обучения под названием "логистическая регрессия" Где X = разница рейтингов, а основание степени 10 и знаменатель 400 - это лишь какие-то коэффициенты, заданные руками, чтобы рейтинги выглядели поприятнее. В случае обычной логистической регрессии у нас есть данные (X, Y), и мы пытаемся подобрать наиболее подходящие веса beta0, beta1. В случае рейтинга нам неизвестен Х, так что мы просто выбираем какие-нибудь коэффициенты beta0, beta1 (например, 0 и 1), и пытаемся определить X (т.е. разницу в рейтинге между игроками) исходя из результата. При этом в формуле логистической регрессии X и параметры beta0,...
    1 балл
  5. до

    Ну, раз уж CFB публикует все колоды из второго дня, то можно попробовать то, что я давно хотел, - посчитать рейтинги отдельно для игроков и отдельно для колод. Из 6К парингов (оба дня) лишь для 1К были известны колоды, поэтому в обсчете участвовали только они. Учитывалась только швейцарка, без топа. Стартовый рейтинг - нулевой, прогнал обучение 10 раз и просуммировал (чтобы получить более надежный, усредненный результат). Очередность побед в ходе турнира не учитывалась - данные обрабатывались разом, как будет все партии были сыграны одновременно. Итоговая погрешность составляет 0.15 (в диапазоне 1 = победа, 0 = поражение, 0.5 = ничья), что так себе. Результат: https://docs.google.com/spreadsheets/d/1tH-in8h-yZ45YRkEXoGk46cVDRZoQ31fZfo3ww02RNo/edit?usp=sharing Как видим, Daniel Toledo на первом...
    -1 балл
  6. до

    Тогда что-то пошло не так, потому что топ1 колода в модерне сейчас Иззет Фениксы (в топ16 этого турнира этой колоды больше всего), а у неё по таблице сплошь плохие матчапы везде. С дреджом тоже что-то не так, это примерно топ2 колода (3 штуки в топе), и тоже плохие проценты в таблице. Вот если бы наоборот, были колонки и строки, то да. Но тогда у других колод что-то не сходится. У УВ например странные числа.
    -1 балл
  7. до

    Как кстати считается эта вероятность победы? Вот например в списке колод был 1 8-Rack и 1 Blue Moon / Breach - у них матчап 48.71%. Они вообще играли? Если играли то такого процента быть не может, потому что максимум 1 матч во втором дне. Если нет, то откуда цифра?
    -1 балл
Таблица лидеров находится в часовом поясе Москва/GMT+03:00
×
×
  • Создать...