一、cookie与session的区别
- cookie 数据存放在浏览器上,服务器能够知道其中的信息。session 数据会在一定时间内保存在服务器上,客户端不知道其中的信息,当访问增多,会比较消耗服务器的性能。
- cookie 不是很安全,别人可以分析存放在本地的 cookie 并进行 cookie 欺骗。session 相对安全,建议将登录信息等重要信息存放为 session。其他信息如果需要保留,可以放在cookie中。
- 单个 cookie 保存的数据不能超过4K,很多浏览器都限制一个站点最多保存20个 cookie。
- session 中保存的是对象,cookie 中保存的是字符串。
- session 不能区分路径,同一个用户在访问一个网站期间,所有的 session 在任何一个地方都可以访问到。cookie 中如果设置了路径参数,同一个网站中不同路径下的 cookie 互相是访问不到的。
二、token的由来
1、最初,web 基本上就是文档的浏览而已。既然是浏览,作为服务器,不需要记录谁在某一段时间里都浏览了什么文档,每次请求都是一个新的 HTTP,就是请求加响应,尤其是不用记住是谁刚刚发了 HTTP 请求,每个请求都是全新的。
2、随着交互式 Web 应用的兴起,如在线购物网站,需要登录的网站等等,就要面临会话管理的问题,必须记住哪些人登录系统,哪些人往自己的购物车中放商品,也就是说必须把每个人区分开。因为 HTTP 请求是无状态的,所以想出的办法就是给大家发一个会话标识(session id),说白了就是一个随机的字符串,每个人收到的都不一样,每次大家发起 HTTP 请求的时候,把该字符串一并发送, 这样就能区分开谁是谁了。
3、这样用户方便了,服务器却受不了了。每个人只需要保存自己的 session id,而服务器要保存所有人的 session id。如果访问服务器多了,就得有成千上万,甚至几十万个。这对服务器说是一个巨大的开销,严重的限制了服务器扩展能力,比如说用两个机器组成了一个集群,小F通过机器A登录了系统,那 session id 会保存在机器A上,假设小F的下一次请求被转发到机器B怎么办?机器B可没有小F的 session id。
有时候会采用一点小伎俩:session sticky,就是让小F的请求一直粘连在机器A上,但是这也不管用,要是机器A挂掉了,还得转到机器B去。那只好做 session 的复制了, 把 session id 在两个机器之间搬来搬去。后来有个叫 Memcached 的支了招:把 session id 集中存储到一个地方,所有的机器都来访问这个地方的数据,这样一来,就不用复制了,但是增加了单点失败的可能性,要是那个负责 session 的机器挂了,所有人都得重新登录一遍。
尝试把这个单点的机器也搞出集群,增加可靠性,但不管如何,这小小的 session 是一个沉重的负担。
4、为什么要保存 session 呢,何不只让每个客户端去保存?可是如果不保存这些 session id,怎么验证客户端发的 session id 是服务器生成的呢?如果不去验证,都无法得知是不是合法登录的用户,万一别人伪造 session id 呢?关键点就是验证。比如说,小F已经登录了系统,服务器给发一个令牌(token),里边包含了小F的 user id,下一次小F再次通过 Http 请求访问的时候,把这个 token 通过 Http header 带过来不就可以了。不过这和 session id 没有本质区别啊,任何人都可以伪造,所以得防止别人伪造。
对数据做签名,用 HMAC-SHA256 算法,加上一个只有服务器才知道的密钥,对数据做一个签名,把这个签名和数据一起作为 token,由于密钥别人不知道,就无法伪造 token 了。
这个 token 服务器不保存,当小F把这个 token 发送过来,服务器再用同样的 HMAC-SHA256 算法和同样的密钥,对数据再计算一次签名,和 token 中的签名做个比较,如果相同,就知道小F已经登录过了,并且可以直接取到小F的 user id。如果不同,数据部分肯定被人篡改过,服务器提示401未授权。
token 中的数据是明文保存的,还是可以被别人看到的,所以不能在其中保存敏感信息。当然,如果一个人的 token 被别人盗用,服务器也会认为盗用者就是合法用户,这其实和一个人的 session id 被别人盗用是一样的。如此,服务器就不保存 session id 了,而只是生成 token,然后验证 token。
服务器用 CPU 计算时间获取了自己的 session 存储空间。
解除了 session id 这个负担,可以说是无事一身轻,机器集群现在可以轻松地做水平扩展,用户访问量增大,直接加机器就行。
三、Cookie
cookie 是一个非常具体的东西,指的就是浏览器里面能永久存储的一种数据,仅仅是浏览器实现的一种数据存储功能。
cookie 由服务器生成,发送给浏览器,浏览器把 cookie 以 kv 形式保存到某个目录下的文本文件内,下一次请求同一网站时会把该 cookie 发送给服务器。由于 cookie 是存在客户端上的,所以浏览器加入了一些限制确保 cookie 不会被恶意使用,同时不会占据太多磁盘空间,所以每个域的 cookie 数量是有限的。
四、Session
session 从字面上讲,就是会话。这个就类似于你和一个人交谈,你怎么知道对方是张三而不是李四呢?对方肯定有某种特征(长相等)表明他就是张三。
session 也是类似的道理,服务器要知道当前发请求给自己的是谁。为了做区分,服务器就要给每个客户端分配不同的“身份标识”。然后客户端每次向服务器发请求的时候,都带上这个“身份标识”,服务器就知道这个请求来自于谁了。至于客户端怎么保存这个“身份标识”,可以有很多种方式,对于浏览器客户端,大家都默认采用 cookie 的方式。
服务器使用 session 把用户的信息临时保存在了服务器上,用户离开网站后 session 会被销毁。这种用户信息存储方式相对 cookie 来说更安全,可是 session 有一个缺陷:如果 web 服务器做了负载均衡,那么下一个操作请求到了另一台服务器的时候 session 会丢失。
1️⃣getsession().getId() 与 getRequestSessionId()的区别:
①HttpServletRequest.getSession().getId() 是服务器端的概念
②HttpServletRequest.getRequestedSessionId() 是客户端就是浏览器的概念。
HTTP 连接是无状态的,那么如何维护一个 Session 呢?其实就是通过 HttpServletRequest.getRequestedSessionId(),如果细心一些,会发现浏览器的地址栏或者状态栏里面的地址后面有时候会带一个 sessionId 的参数值,这就是 HttpServletRequest.getRequestedSessionId() 的返回值。而且这个值一般也会存在 cookie 里面,这样就避免了在每次请求的时候都带在请求的 URL 里面或者 FORM 里面,它是随着浏览器和服务器端的 Cookie 进行交流,对于用户和开发人员是透明的。
五、Token
在 Web 领域基于 Token 的身份验证随处可见。在大多数使用 Web API 的互联网公司中,tokens 是多用户下处理认证的最佳方式。以下几点特性会在程序中使用基于 Token 的身份验证:
- 无状态、可扩展
- 支持移动设备
- 跨程序调用
- 安全
大部分见到过的 API 和 Web 应用都使用 tokens。例如 Facebook、Twitter、Google+ 和 GitHub 等。
Token 的起源。在介绍基于Token的身份验证的原理与优势之前,不妨先看看之前的认证都是怎么做的。
1️⃣基于服务器的验证
HTTP 是无状态的,这种无状态意味着程序需要验证每一次请求,从而辨别客户端的身份。在这之前,程序都是通过在服务端存储的登录信息来辨别请求的。这种方式一般都是通过存储 Session 来完成。随着 web应用程序,以及移动端的兴起,这种验证的方式逐渐暴露出了问题。尤其是在可扩展性方面。
2️⃣基于服务器验证方式暴露的一些问题
- Seesion:每次认证用户发起请求时,服务器需要去创建一个记录来存储信息。当越来越多的用户发请求时,内存的开销也会不断增加。
- 可扩展性:在服务端的内存中使用 Seesion 存储登录信息,伴随而来的是可扩展性问题。
- CORS(跨域资源共享):当需要让数据跨多台移动设备上使用时,跨域资源的共享会是一个让人头疼的问题。在使用 Ajax 抓取另一个域的资源,就可以会出现禁止请求的情况。
- CSRF(跨站请求伪造):用户在访问银行网站时,他们很容易受到跨站请求伪造的攻击,并且能够被利用其访问其他的网站。
在这些问题中,可扩展性是最突出的。因此有必要去寻求一种更行之有效的方法。
3️⃣基于Token的验证原理
基于 Token 的身份验证是无状态的,无需将用户信息存在服务器或 Session 中。这种概念解决了在服务端存储信息时的许多问题。NoSession 意味着程序可以根据需要去增减机器,而不用去担心用户是否登录。
基于 Token 的身份验证的过程如下:
- 用户通过用户名和密码发送请求。
- 程序验证。
- 程序返回一个签名的 token 给客户端。
- 客户端储存 token,并且用于每次发送请求。
- 服务端验证 token 并返回数据。
每一次请求都需要 token。token 应该在 HTTP 的头部发送,从而保证 Http 请求无状态。同样通过设置服务器属性Access-Control-Allow-Origin:*
,让服务器能接受到来自所有域的请求。需要注意的是,在 ACAO 头部标明(designating)*时,不得带有像 HTTP 认证,客户端 SSL 证书和 cookies 的证书。
- 用户登录校验,校验成功后就返回 Token 给客户端。
- 客户端收到数据后保存在客户端。
- 客户端每次访问 API 时携带 Token 到服务器端。
- 服务器端采用 filter 过滤器校验。校验成功则返回请求数据,校验失败则返回错误码。
当在程序中认证了信息并取得 token 之后,便能通过这个 Token 做许多的事情。甚至能创建一个基于权限的 token 传给第三方应用程序,从而使这些第三方程序能够获取到数据(当然只有在允许的特定的token)
4️⃣Tokens的优势
无状态、可扩展
在客户端存储的 Tokens 是无状态的,并且能够被扩展。基于这种无状态和不存储 Session 信息,负载均衡器能够将用户信息从一个服务传到其他服务器上。如果将已验证的用户的信息保存在 Session 中,则每次请求都需要用户向已验证的服务器发送验证信息(称为Session亲和性)。用户量大时,可能会造成一些拥堵。但是使用 tokens 之后这些问题都迎刃而解,因为 tokens 自己 hold 住了用户的验证信息。
安全性
请求中发送 token 而不再是发送 cookie 能够防止 CSRF(跨站请求伪造)。即使在客户端使用 cookie 存储 token,cookie 也仅仅是一个存储机制而不是用于认证。不将信息存储在 Session 中,减少了对 session 操作。token 是有时效的,一段时间之后用户需要重新验证。服务器也不一定需要等到 token 自动失效,token 有撤回的操作,通过 token revocataion 可以使一个特定的 token 或是一组有相同认证的 token 无效。
可扩展性
Tokens 能够创建与其它程序共享权限的程序。例如,能将一个随便的社交帐号和自己的大号(Fackbook或是Twitter)联系起来。当通过服务登录Twitter(将这个过程Buffer)时,可以将这些Buffer附到Twitter的数据流上(we are allowing Buffer to post to our Twitter stream)。使用tokens时,可以提供可选的权限给第三方应用程序。当用户想让另一个应用程序访问它们的数据,服务器可以通过建立自己的API,得出特殊权限的tokens。
多平台跨域
先来谈论一下CORS(跨域资源共享),对应用程序和服务进行扩展的时候,需要介入各种各种的设备和应用程序。
Having our API just serve data, we can also make the design choice to serve assets from a CDN. This eliminates the issues that CORS brings up after we set a quick header configuration for our application.
只要用户有一个通过了验证的 token,数据和资源就能够在任何域上被请求到。
Access-Control-Allow-Origin: *
基于标准创建 token 的时候,可以设定一些选项。