安装moses笔记

先把一些常用程序装了:

yum -y install wget gcc gcc-c++ flex bison make bind bind-libs bind-utils openssl openssl-devel perl quota libaio libcom_err-devel libcurl-devel gd zlib-devel zip unzip libcap-devel cronie bzip2 db4-devel cyrus-sasl-devel perl-ExtUtils-Embed libstdc++.so.6 libnspr4.so libssl.so.6

用winscp把三个文件上传到/home/moses。

进入moses目录:

cd moses

按照一些依赖:

yum -y install libicu-devel python-devel bzip2-devel

解压缩boost_1_59_0.zip:

unzip boost_1_59_0.zip

cd boost_1_59_0

运行:

./bootstrap.sh

然后,运行:

./b2 –build-type=complete –layout=tagged

等待……等待……等待……

安装,不知道这一步是否必要:

./b2 install

boost安装完成。接下去装giza++

cd ..

tar xzvf giza-pp-v1.0.7.tar.gz

cd giza-pp

make

mkdir -p bin

cp GIZA++-v2/GIZA++ bin/

cp GIZA++-v2/snt2cooc.out bin/

cp mkcls-v2/mkcls bin/

ZIGA++安装完毕

接下去安装irstlm

cd ..

tar zxvf irstlm-5.80.08.tgz

cd irstlm-5.80.08

cd trunk

yum install libtool

./regenerate-makefiles.sh

./configure –prefix=/home/moses/irstlm-5.80.08

make

make install

irstlm安装完成

cd ../..

yum install git

git clone git://github.com/moses-smt/mosesdecoder.git

cd mosesdecoder

./bjam –with-irstlm=/home/moses/irstlm-5.80.08 –with-giza=/home/moses/giza-pp/bin

 

 

 

 

 

 

 

安装 scws出现 autoconf 需要先安装

安装在终端操作,

curl -OL http://ftpmirror.gnu.org/autoconf/autoconf-latest.tar.gz
tar xzf autoconf-latest.tar.gz
cd autoconf-*./configure –prefix=/usr/local
make
sudo make install
这样就把autoconf安装到/usr/local/bin/下面了。

接着在执行以下终端命令安装PECL uploadprogress

phpize # prepares the PHP extension for compiling
./configure
make
sudo make install

我把下载好的uploadprogress包放在/usr/include/php/ext中。然后cd到这个目录下,执行以上的终端命令。

如果是宝塔面板:

   3) 执行 ./configure --with-scws=/usr/local/scws 
       若 php 安装在特殊目录 $php_prefix, 则请在 configure 后加上 --with-php-config=/www/server/php/54/bin/php-config

最后终端显示

Installing shared extensions: /usr/lib/php/extensions/no-debug-non-zts-20060XXX/

就表示安装完成。

然后修改php.ini 在/etc中。

本来应该修改extensions dir的路径。但是我是在是不敢随便动这个Paths and Directories 里的东西,所以就写了个全路径extension=”/usr/lib/php/extensions/no-debug-non-zts-20090XXX/uploadprogress.so”。结果重启apache以后,显示upload包已经启动了。

设置 SSH 通过密钥登录

我们一般使用 PuTTY 等 SSH 客户端来远程管理 Linux 服务器。但是,一般的密码方式登录,容易有密码被暴力破解的问题。所以,一般我们会将 SSH 的端口设置为默认的 22 以外的端口,或者禁用 root 账户登录。其实,有一个更好的办法来保证安全,而且让你可以放心地用 root 账户从远程登录——那就是通过密钥方式登录。

密钥形式登录的原理是:利用密钥生成器制作一对密钥——一只公钥和一只私钥。将公钥添加到服务器的某个账户上,然后在客户端利用私钥即可完成认证并登录。这样一来,没有私钥,任何人都无法通过 SSH 暴力破解你的密码来远程登录到系统。此外,如果将公钥复制到其他账户甚至主机,利用私钥也可以登录。

下面来讲解如何在 Linux 服务器上制作密钥对,将公钥添加给账户,设置 SSH,最后通过客户端登录。

1. 制作密钥对

首先在服务器上制作密钥对。首先用密码登录到你打算使用密钥登录的账户,然后执行以下命令:

[root@host ~]$ ssh-keygen  <== 建立密钥对
Generating public/private rsa key pair.
Enter file in which to save the key (/root/.ssh/id_rsa): <== 按 Enter
Created directory '/root/.ssh'.
Enter passphrase (empty for no passphrase): <== 输入密钥锁码,或直接按 Enter 留空
Enter same passphrase again: <== 再输入一遍密钥锁码
Your identification has been saved in /root/.ssh/id_rsa. <== 私钥
Your public key has been saved in /root/.ssh/id_rsa.pub. <== 公钥
The key fingerprint is:
0f:d3:e7:1a:1c:bd:5c:03:f1:19:f1:22:df:9b:cc:08 root@host

密钥锁码在使用私钥时必须输入,这样就可以保护私钥不被盗用。当然,也可以留空,实现无密码登录。

现在,在 root 用户的家目录中生成了一个 .ssh 的隐藏目录,内含两个密钥文件。id_rsa 为私钥,id_rsa.pub 为公钥。

2. 在服务器上安装公钥

键入以下命令,在服务器上安装公钥:

[root@host ~]$ cd .ssh
[root@host .ssh]$ cat id_rsa.pub >> authorized_keys

如此便完成了公钥的安装。为了确保连接成功,请保证以下文件权限正确:

[root@host .ssh]$ chmod 600 authorized_keys
[root@host .ssh]$ chmod 700 ~/.ssh

3. 设置 SSH,打开密钥登录功能

编辑 vi /etc/ssh/sshd_config 文件,进行如下设置:

RSAAuthentication yes
PubkeyAuthentication yes

另外,请留意 root 用户能否通过 SSH 登录:

PermitRootLogin yes

当你完成全部设置,并以密钥方式登录成功后,再禁用密码登录:

PasswordAuthentication no

最后,重启 SSH 服务:

[root@host .ssh]$ service sshd restart

4. 将私钥下载到客户端,然后转换为 PuTTY 能使用的格式

使用 WinSCP、SFTP 等工具将私钥文件 id_rsa 下载到客户端机器上。然后打开 PuTTYGen,单击 Actions 中的 Load 按钮,载入你刚才下载到的私钥文件。如果你刚才设置了密钥锁码,这时则需要输入。

载入成功后,PuTTYGen 会显示密钥相关的信息。在 Key comment 中键入对密钥的说明信息,然后单击 Save private key 按钮即可将私钥文件存放为 PuTTY 能使用的格式。

今后,当你使用 PuTTY 登录时,可以在左侧的 Connection -> SSH -> Auth 中的 Private key file for authentication: 处选择你的私钥文件,然后即可登录了,过程中只需输入密钥锁码即可。

Navicat中文乱码问题

在“连接属性”的设置中,高级-“使用mysql字符集”去掉钩,并且将编码改为10008-GB2312.
然后进入navicat的控制台后,show variables like ‘char%’;命令后如下:
+————————–+—————————————+
| Variable_name            | Value                                 |
+————————–+—————————————+
| character_set_client     | latin1                                |
| character_set_connection | latin1                                |
| character_set_database   | utf8                                  |
| character_set_filesystem | binary                                |
| character_set_results    | latin1                                |
| character_set_server     | utf8                                  |
| character_set_system     | utf8                                  |
| character_sets_dir       | D:\mysql-5.1.32-win32\share\charsets\ |

此时我们需要在控制台运行 set names ‘gbk’命令,运行后再次show variables like ‘char%’;命令查看结果如下:

+————————–+—————————————+
| Variable_name            | Value                                 |
+————————–+—————————————+
| character_set_client     | gbk                                   |
| character_set_connection | gbk                                   |
| character_set_database   | utf8                                  |
| character_set_filesystem | binary                                |
| character_set_results    | gbk                                   |
| character_set_server     | utf8                                  |
| character_set_system     | utf8                                  |
| character_sets_dir       | D:\mysql-5.1.32-win32\share\charsets\ |

客户端连接环境设置算是完成了。接着中文数据该怎么插还是怎么插,不会再有乱码出现。

至于从.sql.txt等文本批量导入数据,则需要将相应的文件转化为gbk格式保存再导入,否则导入后会乱码