一 处理流程
1.读取txt内容。
2.句子拆分
3.解析出姓名,以及每人对应说的话
4.输出全部姓名,将文字语言转换成程序逻辑
5.计算出有多少组合可能
二 详细分析
1. 读取txt内容,去除换行符,拼接成一个字符串
2.将字符串拆分成句子。拆分可以以? ! . 三个符号就行拆分。注意,这三个符号可能会在双引号""里,要特殊逻辑处理下,如果这句中只有一个引号,且下一句开头是引号,那么这个引号是前一句的。
当然最好都加入些异常处理,例如txt读取失败,或者格式不对,那么直接返回no solution。
3.获取所有出现的名字,按照要求里说明的,除了句子开头,和Sir/Sirs 以外首字母大写的都是名字,当然还有I也不是名字。可以将名字用set存储(去重),同时用一个dictionary存储名字和他所对应说的话,这里的话是指双引号内的句子,例如{A:["I am a knight","all
of us are knight"],B:[“I am a knight”]},每个人会对应多句,所以value用list.
处理到这里已经可以获取到全部的名字。记得要排序和输出格式,大于一个用Sirs,等于一个用Sir。
4.将3里处理好的dictionary中的自然语言转换成程序语言,双引号里的情况就是要求的那8种。这里可以用一个dictionary,key为人名,value还是一个dictionary,里面存放我们设计好的key。例如
key:all-knight,里存放全部被描述为knight的名字,对应为”all of us are knight”, ”I am a knight”,”Conjunction_of_sirs areknights”,”Sir sir_name is a knight”。
同理all-knave把上面的knight替换为knave。
Key:one-least-knight/one-least-knave对应为,“at least …”,“Disjunction_of_Sirs”
Key:one-most-knight/one-most-knave对应为“at most …”
Key:exactly-one-knight/exactly-one-knave,对应为“exactly one”
对应的value存储名字,可以用set,
如何分析文字语言对用到哪个组别里,可以用正则re,或者直接关键词判断,例如:
通过most in ,exactly,in ,least in 其他4种场景处理,
名字的处理与3中一样,注意us 和 I的映射
对于all-knight 直接场景直接加入到set
one-least场景,例如 存在A or Bor C is knight 和 A or B is knight,那么处理的结果为 只要满足 A or B is knight即可,C为什么不影响判断,那么one-least是取交集
one-most场景 A B 最多有一个knight. A B C最多一个knight,那么需要满足 A B C最多一个knight,即取并集
exactly-one场景 A B C 只有一个knight A B 只有一个knight,那么需要满足A B 只有一个knight C 为knave,即取交集保留到exactly-one,差集加入到all_knave
5. 根据4得到的dictionary进行计算有多少满足条件的组合,每人都有两种可能要那么为knight 要么为knave,如果有n个人,那么就有2^n种可能。获取全部可能然后依次带入到4中的条件限制内,如果A 为knight,那么所有的条件返回的结果都为true,否则都为false,得到满足的情况。
其中全集的获取可以利用二进制,例如 存在3个人,那么有2^3=8种场景,那么对用为0-7,的二进制000 ---- 111 ,可以用0 表示 knight 1 表示knave。
按照以上处理流程,即完成了ass1.
三 优化
上面5中,存在优化空间。
1) 存在n个人,那么生成的全量为2^n,同时存在m个限制条件,那么时间复杂度为m*(2^n) 的时间复杂度。考虑test_2.txt的场景,Frank Nina Paul 三个人,存在限制条件的只有Nina,那么就意味着Frank,Paul是什么身份都不影响最后的结果,那么只需要获取Nina的可能性为knight 或knave,得到两种可能,在乘上2^2 = 4 (每人两个可能,两个人Frank,Paul)最后答案为8个solution.
2) 上面只是减少了n的大小,但2^n的数量空间还是没变。这时候考虑用剪枝的方式,例如 存在8种可能 分别为
000 001 010 100 011 101 110 111 三种情况,那么先判断第一个人为0是否满足条件,如果不满足,那么上面所有0开头的场景都可以排除。
3) 让2)中更早的剪枝掉不满足要求的情况,那么先处理容易确认性的判断,在处理不容易判断的场景
4) 2)3)解决了时间复杂度的问题,但空间复杂度仍未2^n,那么可以用栈来解决空间复杂度
四 考点总结
1. txt文件的读取
2. 字符串分割
3. 集合 交集 并集 差集
4. 全排序,剪枝,栈的运用