AWS 常见问题记录(13-24)

1. Athena 查询长时间无反应,也不扫描数据

Athena是serverless服务,因此会使用公用的资源池,提供不同的使用者所提交的各个查询一同使用资源。当一个查询被提交时,Athena系统会估算该查询需要用到的资源数量,并向资源池申请资源,成功获得资源后,会将相关的Stage与Task派发在这些资源的Presto worker上运行。在这一系列的工作流程中,若资源池的资源较为稀缺时,则从申请资源到成功获得资源所耗费的时间就会比较长。
通常资源相关的问题,可以借由重试(将完全相同的查询命令重跑一次)来解决。因为Athena会自动弹性维护资源池,重试操作会发出新的查询,重新发出申请资源的请求,提高申请到底层资源的机率。在大多数情况下,资源相关的问题都能够借由重试来解决。
为什么我的 Amazon Athena 查询运行时间很长

2.elasticache 创建后连接不上

外网是要开传输加密后才能连的,先看内网连接。
创建时不选传输加密内网时可以直接连的,不需要特殊设置。
不能连的话,先检查集群的安全组有没有对内网测试的ec2放开6379的权限,
telnet 测试下主终端节点通不通。
通的话说明网络正常,看下开了传输加密没有,开的话要加 --tls 参数才能连。
连接到集群节点

3. vpc 内无法解析内网域名地址

看下你的vpc属性那里,开了 dns 解析没有,开了当前 vpc 内的地址肯定是可以解析的。
还有种情况是跨 vpc的,开了vpc peering的,一个vpc内的机器没法解析另一端的vpc的内网域名地址,
这个需要特殊设置dns的域名解析,具体参考下面的文档
实现对对等连接的 DNS 解析

4. rds mysql 中的 rdsadmin

在 rds mysql 中查 user 表,能发现一个用户叫 rdsadmin,这个是 aws 自己建的,用于管理集群升级备份等操作的。不要去删除,修改这个用户和它的权限,会导致集群出错的。

18f1e835934892f1f74b8dcb11d5590.png

要为每个数据库实例提供管理服务,需在创建数据库实例时创建 rdsadmin 用户。如果试图删掉、重命名、修改密码,或者修改 rdsadmin 账户的权限,会导致出错。
https://docs.aws.amazon.com/zh_cn/AmazonRDS/latest/UserGuide/CHAP_MySQL.html

5. GA 详细日志和监控分析

如果想要查 ga 的日志和监控信息,比如网络波动或者用户连接情况,只能用 aws cli 开 ga 的 flow log 。 之后用 athena 去查。查询 AWS Global Accelerator 流日志

6. glue 表版本的配额限制

glue 中的表在没修改一次表设置(表结构,名称,路径等)都会生成一个历史记录,每个历史记录都有一个版本号,是从0开始的自增序列。默认的上限是10万。虽然看着很多,但是如果你的代码里有经常修改表设置的,还是有可能刷满配额的,这个时候就不能再修改了。你可以开 case 提升这个配额,不过有上限总会打满的,可以使用 aws 的接口批量删除旧的版本。


batch-delete-table-version — AWS CLI 2.7.0 Command Reference (amazonaws.com)

7. lambda vpc 内访问其他账号的 S3

有些服务在 vpc 私有子网,为了访问这些服务,lamda 也要搭在 vpc 内,这时 lambda 需要 nat 才能访问到公网的资源,但是如果访问的是 aws 的服务的话,可以创建对应服务的终端节点,让 lambda 直接在内网访问到这些服务。因此也可以通过终端节点访问 s3,不过终端节点是建在 vpc 上的,你的 vpc 和你的 s3 桶必须在同一 region,否则 lambda 会直接报 time out。
同一 region 下的 s3 其实都是在同一个地方,即使账号不同。所以建了终端节点后,内网访问其他账号的 s3 桶也是可以的。

8. EMR 中 yarn 可调度的内存很少

启动了2台 m5.xlarge 的 emr 集群,总的内存 32GB,但是在 yarn 的 web 页面看到总内存才12GB。这应该是个bug,根据文档,单台 m5.xlarge 的 yarn 可用内存应该是 12GB 多点。试了其他机型,都是和文档相符的。不过这个参数也可以在控制台修改,调整到文档给出的值就好。
yarn.nodemanager.resource.memory-mb
yarn.scheduler.maximum-allocation-mb
任务配置 - Amazon EMR

9. 报权限错误时带了一串编码的字符串

有时遇到一些权限上的错误,控制台上或者 cli 会报出如下的错误,后面还跟了很长的编码后的字符串,这个的意思是权限错误的具体信息被加密了,想要得到原信息必须用报出这个错的账号去执行 decode-authorization-message 这个命令去解密。注意:执行这个命令也需要单独的权限,请先确保你有sts服务下的这个权限,再去执行解密命令。
Service role test-emr-role has insufficient EC2 permissions. EC2 Message: AmazonEC2Exception: You are not authorized to perform this operation. Encoded authorization failure message
Amazon EC2 中 RunInstances 的编码授权失败

10. EMR 扩充 core 节点的磁盘空间

emr 中 yarn 的日志默认是保存在 hdfs 上的,保存期限是2天,物理位置是在 core 节点上。100G的节点实际只有30G左右可以用来存日志,3台 master 的话就是100G。如果你的日志刷的过快,把hdfs写满了,程序就会报错,这时要么调节日志保留期,要么扩core节点的存储空间。
扩充存储空间需要在ec2页面操作,EMR是没有直接修改磁盘的设置的,就把core节点当作一个普通的ec2实例,找到对应的ebs磁盘,然后调整大小,再到实例里面扩容就好了。
需要注意的是,core有两个硬盘设备


df -T看到的是nvme而不是sbc

对于 amazon linux2,可以用sudo /sbin/ebsnvme-id /dev/nvme1n1来查看映射关系

之后还需要在实例里面 growpart 和 resize。
以扩充 /mnt 为例
sudo growpart /dev/nvme1n1 2
sudo xfs_growfs /dev/nvme1n1p2
调整卷大小后扩展 Linux 文件系统 - Amazon Elastic Compute Cloud

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 203,547评论 6 477
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,399评论 2 381
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 150,428评论 0 337
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,599评论 1 274
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,612评论 5 365
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,577评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,941评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,603评论 0 258
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,852评论 1 297
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,605评论 2 321
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,693评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,375评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,955评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,936评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,172评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 43,970评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,414评论 2 342

推荐阅读更多精彩内容

  • 记录自己支持过程中客户提到的一些代表性的问题。 1. cn 区域的 S3 和 apigateway 开启公开访问权...
    Houtasu阅读 1,066评论 0 0
  • MySQL 和 PostgreSQL 的 IAM 数据库身份验证 身份验证令牌 是 Amazon RDS 根据请求...
    Aar0N_333b阅读 2,356评论 0 3
  • 前言 因工作内容需要,需要大量基于aws去构建系统。因为此前没有aws的任何经验,最近学习了一波aws的一些服务,...
    西部小笼包阅读 3,118评论 0 2
  • 已过SAA认证,贴出知识点总结 EC2 IAM Applications that run on an EC2 i...
    NealLemon阅读 950评论 0 2
  • 接上 AWS 考试认证心得(SAA)(上)[https://www.jianshu.com/p/56fa483e0...
    烧杰阅读 5,493评论 2 5