C#Shuffle算法(洗牌算法、抽样算法)

Fisher-Yates Shuffle算法

1.创建一个新的list
2.随机取出当前0-list.Count其中一个数
3.把老list当前随机数位置添加到新list
4.老list删除这个数
5.直到老list.Count=0结束返回

    public void FisherYatesShuffle<T>(List<T> list)
    {
        List<T> cache = new List<T>();
        int currentIndex;
        while (list.Count > 0)
        {
            currentIndex = Random.Range(0, list.Count);
            cache.Add(list[currentIndex]);
            list.RemoveAt(currentIndex);
        }
        for (int i = 0; i < cache.Count; i++)
        {
            list.Add(cache[i]);
        }       
    }

随机性 可验证每一个数的概率都是相等的

一个元素m被放入第i个位置的概率P = 前i-1个位置选择元素时没有选中m的概率 * 第i个位置选中m的概率


image.png

时间复杂度为O(n^2)空间复杂度为O(n)

Knuth-Durstenfeld Shuffle算法

是上面板的升级版本 不用new新的list 在原list进行交换
1.随机取出当前0-list.Count-i的数(就是相当于不移除,要从后每次遍历都要从后往前空出一个位置给随机完的数交换到(最后一个-i)这个位置)
比如一共1234
你在前四个随机一个2 2和4交换 成了1432
然后在前三个随机 只能随机到143其中一个
就按3来说 他和自己交换就是位置不变 成了1432
然后在前两个交换 比如随机了一个1 和4交换 成了4132
最后一个不交换不然会数组越界
2.把当前随机的数和最后空出来的数交换
这样可以确保不会重复随机

   public void KnuthDurstenfeldShuffle<T>(List<T> list)
    {
        //随机交换
        int currentIndex;
        T tempValue;
        for (int i = 0; i < list.Count; i++)
        {
            currentIndex = Random.Range(0, list.Count - i);
            tempValue = list[currentIndex];
            list[currentIndex] = list[list.Count - 1 - i];
            list[list.Count - 1 - i] = tempValue;
        }
    }

然后用forr优化 因为for循环每次都获取list.count比较 而forr是反向 只用获取一次
不过有局限因为只有开始获取了长度而不是每次获取 导致必须一开始知道长度 长度未知的话只能用第一种

    public void KnuthDurstenfeldShuffle<T>(List<T> list)
    {
        //随机交换
        int currentIndex;
        T tempValue;      
        for (int i = list.Count - 1; i >= 0; i--)
        {
            currentIndex = Random.Range(0, i+1);
            tempValue = list[currentIndex];
            list[currentIndex] = list[i];
            list[i] = tempValue;
        }
    }

随机性


image.png

也是相等的
时间复杂度为O(n)空间复杂度为O(1)
是最佳的洗牌算法

Inside-Out Algorithm算法

上面算法是内部打乱算法 如果我们想保留数据需要另外开辟一个List保存 我觉得跟上面的差不多就用个list保存 数组是struct可以直接赋值时间复杂度可能是O(n)

public List<T> InsideOutAlgorithm<T>(List<T> list)
    {
        List<T> cache = new List<T>();
        for (int i = 0; i < list.Count; i++)
        {
            cache.Add(list[i]);
        }
        //随机交换
        int currentIndex;
        T tempValue;
        for (int i = cache.Count - 1; i >= 0; i--)
        {
            currentIndex = Random.Range(0, i + 1);
            tempValue = cache[currentIndex];
            cache[currentIndex] = cache[i];
            cache[i] = tempValue;
        }
   
        return cache;
    }

时间复杂度为O(n^2)空间复杂度为O(n)

ReservoirSampling蓄水池抽样算法

如果我们想从一个从N个元素中随机的抽取k个元素,其中N无法确定 就要用到这个算法
其实还有一种算法一开始会想到等概率抽取法,每次在(0,n-1)随机一个数,随机m次如果有相同的重新随机。如果N较大也可能不确定大小就只能用蓄水池抽样了
1.先把读到的前k个对象放入“水库”
2.对于第k+1个对象开始,以k/(k+1)的概率选择该对象,以k/(k+2)的概率选择第k+2个对象,以此类推,以k/m的概率选择第m个对象(m>k)。
3.如果m被选中,则随机替换水库中的一个对象。最终每个对象被选中的概率均为k/n,证明如下。

第m个对象被选中的概率=选择m的概率(其后元素不被选择的概率+其后元素被选择的概率不替换第m个对象的概率)

image.png

每个元素被抽中概率相等

  public List<T> ReservoirSampling<T>(List<T> list, int m)
    {
        List<T> cache = new List<T>(m);
        for (int i = 0; i < m; i++)
        {
            cache.Add(list[i]);
        }
        int currentIndex;
        for (int i = m; i < list.Count; i++)
        {
            currentIndex = Random.Range(0, i + 1);
            if (currentIndex < m)
            {
                 cache[currentIndex] = list[i];
            }
        }
        return cache;
    }
©著作权归作者所有,转载或内容合作请联系作者
【社区内容提示】社区部分内容疑似由AI辅助生成,浏览时请结合常识与多方信息审慎甄别。
平台声明:文章内容(如有图片或视频亦包括在内)由作者上传并发布,文章内容仅代表作者本人观点,简书系信息发布平台,仅提供信息存储服务。

相关阅读更多精彩内容

  • 导语: 如果你已经加入了iOS攻城狮队伍,那么我们由衷地祝贺您正式成为一名终身学习的程序猿;有人觉得这句话...
    超人猿阅读 7,146评论 3 19
  • 2018年10月8日 /*本节主要内容:1、 时间复杂度2、冒泡排序3、选择排序4、插入排序5、对数器概念和使用6...
    须臾之北阅读 4,153评论 0 0
  • 子曰:“诗三百,一言以蔽之,曰‘思无邪’。”这句话是最恰当不过了。在周代尚未受到封建礼教的毒害时,女子都是无所拘束...
    沉无阅读 2,895评论 2 4
  • 云竹岭的童子鸡上架之后,家里就开启了没完没了的辣子鸡盛宴,边写边流口水!童子鸡烧辣子鸡真是超级鲜嫩!超级入味!超级...
    卖土鸡的小不拉拉阅读 4,852评论 3 51
  • 祝贺刘以林兄演讲成功,特作诗以应 大海空明,当下天堂。 长天驭风,苍穹明净。 岛恋长滩,海境胜殊。 洞阔清朗,气清...
    晓霞_e49d阅读 1,625评论 0 3

友情链接更多精彩内容