ドキュメンテーション

一般的な问题のトラブルシューティング

この节では,马铃薯草®并行服务器™ソフトウェアで発生する可能性がある问题の解决方法について说明します。

ライセンスエラー

MATLABワーカーを动弹するにに,ライセンスの问题が発生物し,次のメッセージが表示されることあります。

许可证结账失败。没有这样的特征存在。许可证管理器错误-5

このエラーは,以下のようなさまざまな理由で表示されます。

  • このこのは,通常,ライセンスのないないないをしとしたこと示します.matlabインストール内にある许可证.DAT.ファイルを确认して,この制品を使用するライセンスがあるか调べます。

  • この制品のライセンスライセンスがライセンスあるあるあるあるある合书,このエラーは,ライセンスファイル内にににキャリッジリターンまたはがあることがででしているいるありますますますあります。服务器守护进程または增量で始まっていることを确认します。

    许可证.DAT.ファイルを修正した,ネットワークネットワークライセンスマネージャーを再再するする,matlabは正式机构するするです。

  • 。

  • MATLAB并行服务器ソフトウェアでワーカーを起动したときにこのエラーが発生した场合は,以下の原因が考えられます。

    • ワーカーワーカーライセンスにアクセスアクセスできない环境环境startways.たとえば,并行计算工具箱™ののクライアントインストール环境からワーカー起すると,次のエラーが,次のエラーが発。

      主机主机名上的MJS服务返回以下错误:启动MATLAB工作者的问题。这个问题的原因是:========================================================.====== Most likely, the MATLAB worker failed to start due to a licensing problem, or MATLAB crashed during startup. Check the worker log file /tmp/mjs_user/node_node_worker_05-11-01_16-52-03_953.log for more detailed information. The mjs log file /tmp/mjs_user/mjs-service.log may also contain some additional information. ===============================================================

      ワーカーログファイルで,次の情iciticalを确认てください。

      许可证结账失败。许可证管理器错误-15 MATLAB无法连接到许可证服务器。检查许可证管理器是否已启动,并且Matlab客户端计算机可以与许可证服务器通信。访问此问题疑难解答:https://www.tatmou.com/support/lme/r2009a/15诊断信息:功金宝app能:matlab_distrib_comp_engine许可证路径:/pps/matlab/etc/license.dat flexnet许可错误:-15,570。系统错误:115

    • 并行计算工具箱制品のみのみインストールしており,同じマシン上でを実実しとすると,このこのエラーが表示されれれはははは,MATLAB并行服务器装饰品ががインストールされておら,ワーカーがライセンスを取得できないです。

unix.オペレーティングオペレーティングシステムでのメモリエラー

unix.®オペレーティングシステム(Linux®またはMacintosh)が稼働するマシン上でサーバーにより作物ます。详细详细について,Macintoshとlinuxででさされるのの(并行计算工具箱)を参照してください。

视窗ネットワークネットワークインストール环境ででのサーバープロセスの行

多重のネットワークは,UNCまたはマッピングされたネットワーク共にlocalsystem.がアクセスできないように构成されます。この场合,サービスとしてログオンする権限をもつ别のユーザーとしてMJSプロセスを実行します。ユーザーの设定を参照してください。

必要なポート

ジョブマネージャー使用时

base_port-mjs_def.。

  • matlabroot./toolbox/parallel/bin/mjs_def.sh.sh.(Unixオペレーティングシステム)

  • matlabroot.\ toolbox \ parallel \ bin \ mjs_def.bat(视窗®オペレーティングシステム)

通信ジョブ -UNIXオペレーティングシステムででで稼ワーカーマシン上で,mpichが通信ジョブ実行に必要するポート番のははポートのは,base_port + 1000からbase_port + 2000.までです。

サードパーティ制スケジューラ使用时

ワーカープロセスがが动词するに,环境函数mpich_port_range.を値MINPORT:MAXPORT.で定义して,ワーカーが通信ジョブで使用するポートの范囲を制御できます。

クライアントポート

关节有关部PCTConfig.ををポートをてクライアントますされるポートポートできますしできできない。

ジョブマネージャーで使使用する一时tcpポート

Windowsオペレーティングシステムが稼働するのクラスタークラスター上でジョブを使する场ででで多数のtcpポートが确実使できばなりませんに既定ばばん。00

  1. レジストリエディターをを起ます。

  2. レジストリで次のサブキーを见つけてて,[パラメーター]をクリックします。

    HKEY_LOCAL_MACHINE \ SYSTEM \ CurrentControlset \ Services \ TCPIP \参数
  3. [レジストリレジストリ]ウィンドウウィンドウ,[编集][新规][DWORD(32ビット)値]を选択します。

  4. 右侧右侧のエントリ覧覧で,新しい値の名前をmaxuserport.に変更し,进入キーを押します。

  5. maxuserport.エントリ名を右クリックし,[修正]を选択します。

  6. [DWORD値値の]ダイアログダイアログ[値値の]フィールドに「65534「とと力します。[表记]の値として[10个数]を选択します。[好的]をクリックします。

    このパラメーターパラメーター,プログラムがシステムに使使使なユーザーポート要求する际最ポート番番をします。通讯,一时(短命)ポート1024から1024から1024から1024からの値を割り当て割り当てます。65534までのポートポート番をことができます。

  7. レジストリエディターを终了します。

  8. マシンを再再起ます。

ホスト通信の问题

ワーカーがmatlabジョブジョブにににに接続ないない场场场スケジューラするを検证できないないががしているない问题が生物しし可性ががありありありありありありありありあり

コマンドラインインターフェイスを使用

まず,问题问题マシンが,解决されたipアドレスととしているを确认してください。特色のホストのipアドレスアドレス,自我から见て,别のホストからて,同じでなければなりなりません,主机上のプロセスが宿舍上のプロセスに接続できできない合书,宿舍の自然のIPアドレスを调べてから,主机から见た宿舍のIPアドレスを确认します。両者は同一でなければなりません。

マシンが相互を识别识别できる合,そのプロセス间の问题の诊断诊断nodestatus.コマンドが役立つ役立つ役立つがあります。この关键を使使て,ローカルホスト上で実行されいるMATLAB并行服务器プロセスを判别し,リモートホストからアクセス可能なものを特定します。宿舍上のワーカーが主机上部のジョブマネージャーに登录できない场综合,両方のホストでnodestatus.を実行しし,それぞれのホストが主机上で参照できるものを确认ますます。

主机で次を実行。

nodeStatus -Remotehost Hostb.

次に宿舍でで同じコマンドをを実しし

nodeStatus -Remotehost Hostb.

结果

出力に问题が示されるれる综合,レベル情レベル高度してコマンドを実し,より详细な情実。

nodeStatus -Remotehost Hostb -Infolevel 3

管理中心GUIを使用

管理中心をを用品

ホスト名を指定しててにホスト正しく追できない场は,代わりにipアドレスを使使(ホストホスト追加を参照)。何ら何らか通信の问题が疑われる合,管理中心guiで[接続接続の]をクリックします(接続性のテストを参照)。このテストにより,ノードが相互を识别,ノードのプロセス间で相互に通信できることが検证されれ。

クラスター検出のためのネットワーク通信の検证

并行计算工具箱でクラスター検出机械を使する合,ネットワークネットワークは少なくとも次のかではさされれなければなりませませてかでばなりませ

DNS SRVレコード

クラスター検出にDNSを使用するには,以下のような一般的な形式のDNS SRVレコードが必要です。

_mdcs._tcp.domainname.com SSSS在SRV PPPP中wwww mjs_port mjs_fqdn_hostname

このレコードは次の部分で构成されています。

  • _mdcs._tcp。レコードレコードはこのテキストから,そのその后にクライアントマシンマシン検索名(公司大学.Edu.など)を指定しなければなりんんん。

  • SSSSはDNSレコードをキャッシュできるできるできるを示します.3600

  • 在SRVはこれがサービスレコードであることを示しており,このとおりに入力する必要があります。

  • pppp.WWWW.は优先を示します,どちらも0にするをしますますますますますますますますますますししますしししますますますますますますますますししますししますますますますますます推奨ししししししししし

  • mjs_port.はmatlabジョブジョブスケジューラサーバーに接続するポートですポート设定设定ははははががががががです侧ののををするする侧はははは场はははは変更场にははははですですはははですですですですはですですですポートポートするですです设定ポートポート

  • mjs_fqdn_hostname.たとえばmatlabジョブスケジューラのホスト完全完全ドメイン名です。たとえば,mjs-1.company.com.です。

マシンMJS-1上でmatlabジョブスケジューラを実実しいる公司のネットワークの有效なDNS SRVレコードは次のようになります。

_mdcs._tcp.company.com 3600在srv 0 0 2 27350 mjs-1.company.com

ごご使ののネットワーク,使用しているdnsシステム标准标准に従っ従っ适切dns srvレコードをにしなにより,ネットワークが必要なdns srvレコードで构ささているをnslookup.たとえば,このシステムはます。たとえば,このシステムは,次のようにするdns srvレコードのするする示し。

nslookup -type = srv _mdcs._tcp.company.com

マルチキャスト

00

マルチキャストはtcp / ipやudpとは异なり,サブスクリプションベースのですです。これこれ,ネットワーク上の多数人のが,ネットワーク上の场所からからされた特定パケットへのををに示すとという。一方,UDPおよびTCPパケットは通讯,IPアドレスで示される単一のマシンのみ向けててされます。

このタイプのパケットを调查するための主なツールは次のとおりです。

  • tcpdump.(Unixオペレーティングシステム)

  • WINPCAP.および飘渺(微软®Windowsオペレーティングシステム)

  • 并列计算制品に付属のjava®クラス。

このjavaクラスはcom.mathworks.toolbox.distcomp.mjs.test.multicasttesterと呼ばれるものです。このクラスの静的主要メソッドとコンストラクターはどちらも2

このjavaクラスには,指定されたマルチキャストグループへ参加を试せるなメソッドががありますしへ参ます功し后,クラスにはもにメッセージをするするもにメッセージメッセージするメソッドメッセージをリッスンするメソッド,受信ししたものを表示メソッドなどがありありこのクラスクラスははははからからからててててからことことも呼び出しててからことももをててからことこともを呼び出してからことこともを呼び出しててからことことを呼び出しててててことことメソッドメソッドてててなどなどなどメソッドメソッドててなどなどなどメソッドメソッドメソッドメソッドなどなどなどメソッドメソッドメソッドメソッドなどなどなどなどメソッドメソッドなどメソッドなどメソッドなどメソッドメソッドなどメソッドメソッドメソッドメソッドメソッドメソッドなどメソッドなどメソッド

シェルプロンプトで次のようにに力します(パス上にjava.ががあるものとします)。

java -cp distcomp.jar com.mathworks.toolbox.distcomp.mjs.test.multicasttester

次のような出力が表示されます。

0:host1name:0 1:host2name:0

次の例は,MATLAB内で的Javaクラスを使用する方法を示します。

マルチキャストをテストする2台のマシン(たとえば,host1name.host2name.)でmatlabを起动词。

m = com.mathworks.toolbox.distcomp.mjs.test.multicastTester('239.1.1.1',9999);M.StartSenchingThread;M.StartListentingThread;

これらの命令により,それぞれのMATLABセッションはマルチキャストテストパケットのストリームを発行し,テストパケットをリッスンします。マルチキャストがマシン间で机能している场合,次のような复数行のストリームが表示されます。

0:host1name:0 1:host2name:0 2:host2name:1 3:host2name:2

各文字ベクトルの左侧左侧数码,诚信したパケット行番のテキスト,パケットののはのをますます。通信ホストが送たパケットホストです送送パケットですです。通信ホストですが送。通信ホストです。通信ホストです。通信ホストです。通信ホストです。通信自我からからのテストテストパケットをしし

いずれかのマシンでテストパケットのストリームを受信しなかった场合,あるいはリモートホストがいずれのストリームにも含まれない场合,マルチキャスト通信は正常に动作していません。

テストストリームを终了するには,両方のMATLABセッションで次を実行します。

M.SopsitingThread;M.StoplistentingThread;