发行说明
SKIL 1.2.1
特点和改进
- “关于”页现在显示许可证到期日期。
- 更新页面以便在许可证过期时更新许可证。
- 内部API更改以获得更稳定的用户界面体验。
- 添加了“支持zip按钮”,用于共享系统信息、日志和流程信息,以获得更好的客户支持。
- 修复了pyspark和spark不匹配的库。
- 安spark无需安装7zip。
- 添加
expirationDate
以获取许可证端点GET /license
。 - 许可证页的Loading指示器。
- 模型服务器v2(管道)的前端更改。
- 修复了Ubuntu Docker对/var/skil的镜像权限。
已知问题
- 用于保存数据的Docker镜像在操作系统上占用大量存储空间。这将很快在以后的版本中得到修复。
- SKIL Launcher(bundle)不适用于Linux。
SKIL 1.2.0
特点和改进
- 新的集中日志获取系统。
- 模型服务器版本控制和回滚。
- 用于监控正在运行的训练和批量推理作业的新作业系统和用户界面。
- 部署中的模型服务器度量仪表板。
- 通过Beam解释器增加了基于Java的笔记本的支持。
- 下一代基于管道的模型服务器。
- PMML实现增加了对Scikit-learn、XGBoost和许多R、Spark和SAS模型的支持。
- 完全可定制的输入前置处理器和输出后置处理器。
- 高效的内存映射向量查找。
- 更高的TensorFlow模型的吞吐量。
- 支持二进制numpy数组和支持输入输出的apache arrow。
- 支持目标检测端点中的自定义类标签。
- 能够通过反馈在模型服务器内重新训练模型。
- 增加了对Windows、Mac和Debian/Ubuntu的支持。
- 包括一个简单的基于GUI的启动程序。
- 企业版现在可以支持Active Directory/LDAP进行身份验证。
- 创建了简化的python API。
- 社区版许可证现在支持10个模型服务器而不是2个,工作间现在不受限制。
已知问题
install-python.bat
脚本中的Deactivate调用有时会导致以下错误:-
<root_SKIL_folder>\miniconda\Scripts\deactivate' is not recognized as an internal or external command, operable program or batch file.
可以安全地忽略这个错误并继续使用SKIL。这将在以后的版本中修复。
在Zeppelin上运行%pyspark脚本时,有时会看到pyspark没有响应错误。将这些问题连同
<root_SKIL_folder>/logs
文件夹下的skil日志文件一起报告给我们。我们正在积极地为以后的版本解决这个问题。
SKIL 1.1.2
特点和改进
- 为大型TensorFlow模型添加性能改进。
SKIL 1.1.1
特点和改进
- skil-server-miniconda现在安装了非GPU版本的python库,这样它们就可以与CPU一起使用了。要在安装了CUDA的服务器上的那些库中启用GPU,请安装与安装的CUDA版本相应的-GPU版本。
- 更新默认笔记本以展示训练DL4J和Keras模型。
- 复制的模型服务器URL现在与客户端API兼容。
已知问题
- Docker 容器有时会下载zeppelin解释器,即使它们已经包含在内。在访问工作间之前,请等待下载完成。查看消息“About to join jetty web server”,了解Zeppelin何时准备就绪。
SKIL 1.1.0
特点和改进
- 大量的错误和性能修复。
- 更新为DL4J 1.0.0-beta,运行在CUDA 9.1上的TensorFlow 1.7用于模型服务器,TensorFlow 1.8用于Zeppelin笔记本。
- 用于管理大量部署和实验的各种UI改进。
- 用于SKIL集群的集中配置和管理UI。
- 添加了模型服务器API。
- 支持目标检测模型,如yolo和ssd。
- 支持具有多个输入和输出的模型。
- 对需要输入掩码的循环网络的扩展支持。
- 支持使用压缩图像作为神经网络的输入,服务器端自动调整大小和归一化。
- 从SKIL中打开笔记本将自动登录到Zeppelin。
- 在外部或云Spark集群上使用DL4J进行Spark训练和推理。
- 嵌入式ZooKeeper现在是持久的,可以在集群模式下使用。
- TensorFlow模型服务器现在在GPU上运行(如果可用)。
已知问题
- 捆绑式miniconda安装错误地需要CUDA。如果遇到此问题,请升级到1.1.1版。
- TensorFlow模型服务器不支持Workers>1。
- 当给定损坏的模型时,模型服务器不会总是进入失败状态。
- 升级后的TensorFlow版本导致ONNX库加载失败。将在稍后的ONNX版本中修复。
- 日志包含有关许可和端口冲突的良性错误。这将在下面的小版本中解决。
SKIL 1.0.3
特点和改进
- 负载均衡器不会在多节点部署中更新模型服务器URL。
- MNIST数据集在benchmark.deeplarn.online上不再可用(数据集将嵌入到RPM中)。
- 模型服务器负载均衡器性能改进。
SKIL 1.0.2
特点和改进
- 现在支持用于推理的多节点SKIL安装。
- 完全离线可安装的RPM。
- 添加了进程的显示名称。
- 能够自定义默认zeppelin服务器的配置。
- 可配置的日志。
- 许多小的用户界面和可用性改进。
已知问题
- 停止部署可能会导致工作区中出现临时错误。只需再次尝试该操作就可以消除错误。
- 目前无法从实验中删除带有附加评估结果的模型。
- SKIL中嵌入的ZooKeeper将数据存储在内存中,重新启动SKIL服务器将在工作间和部署中导致错误。建议使用外部Zookeeper。